Validation of a data mining model against traditional dental age estimation methods among Korean adolescents and young adults

شكرا لك على زيارة nature.com. إن إصدار المستعرض الذي تستخدمه له دعم محدود CSS. للحصول على أفضل النتائج ، نوصي باستخدام إصدار أحدث من متصفحك (أو إيقاف تشغيل وضع التوافق في Internet Explorer). في غضون ذلك ، لضمان الدعم المستمر ، نعرض الموقع دون تصميم أو JavaScript.
تعتبر الأسنان المؤشر الأكثر دقة على عمر جسم الإنسان وغالبًا ما تستخدم في تقييم عمر الطب الشرعي. كنا نهدف إلى التحقق من صحة تقديرات سن الأسنان المستندة إلى البيانات من خلال مقارنة دقة التقدير وأداء التصنيف لعتبة 18 عامًا مع الأساليب التقليدية وتقديرات العمر القائمة على تعدين البيانات. تم جمع ما مجموعه 2657 صورة شعاعية بانورامية من المواطنين الكوريين واليابانيين الذين تتراوح أعمارهم بين 15 و 23 عامًا. تم تقسيمها إلى مجموعة تدريب ، تحتوي كل منها على 900 صورة شعاعية كورية ، ومجموعة اختبار داخلية تحتوي على 857 صورة شعاعية يابانية. قارنا دقة التصنيف وكفاءة الأساليب التقليدية مع مجموعات الاختبار من نماذج استخراج البيانات. تكون دقة الطريقة التقليدية في مجموعة الاختبار الداخلية أعلى قليلاً من نموذج نموذج استخراج البيانات ، والفرق صغير (يعني الخطأ المطلق <0.21 سنة ، خطأ مربع متوسط <0.24 سنة). يتشابه أداء التصنيف لقطعة 18 عامًا أيضًا بين الأساليب التقليدية ونماذج استخراج البيانات. وبالتالي ، يمكن استبدال الأساليب التقليدية بنماذج استخراج البيانات عند إجراء تقييم عمر الطب الشرعي باستخدام نضج الأضراس الثانية والثالثة في المراهقين الكوريين والشباب.
يستخدم تقدير سن الأسنان على نطاق واسع في طب الطب الشرعي وطب الأسنان عند الأطفال. على وجه الخصوص ، نظرًا لارتفاع العلاقة بين العمر الزمني وتنمية الأسنان ، يعد تقييم العمر بواسطة مراحل تنمية الأسنان معيارًا مهمًا لتقييم عمر الأطفال والمراهقين. ومع ذلك ، بالنسبة للشباب ، فإن تقدير سن الأسنان بناءً على نضج الأسنان له حدوده لأن نمو الأسنان قد اكتمل تقريبًا ، باستثناء الأضراس الثالثة. الغرض القانوني هو تحديد عصر الشباب والمراهقين هو تقديم تقديرات دقيقة وأدلة علمية حول ما إذا كانوا قد وصلوا إلى سن الأهلية. في ممارسة Medico-Legal للمراهقين والشباب في كوريا ، تم تقدير Age باستخدام طريقة Lee ، وتم التنبؤ بعتبة قانونية قدرها 18 عامًا بناءً على البيانات التي أبلغ عنها Oh et al 5.
التعلم الآلي هو نوع من الذكاء الاصطناعي (AI) الذي يتعلم مرارًا وتكرارًا وتصنيف كميات كبيرة من البيانات ، ويحل المشكلات بمفردها ، ويدفع برمجة البيانات. يمكن أن يكتشف التعلم الآلي أنماطًا مخفية مفيدة في أحجام كبيرة من Data6. على النقيض من ذلك ، قد يكون للأساليب الكلاسيكية ، التي تكون كثيفة العمالة وتستغرق وقتًا طويلاً ، قيودًا عند التعامل مع كميات كبيرة من البيانات المعقدة التي يصعب معالجتها يدويًا 7. لذلك ، أجريت العديد من الدراسات مؤخرًا باستخدام أحدث تقنيات الكمبيوتر لتقليل الأخطاء البشرية ومعالجة البيانات متعددة الأبعاد بكفاءة 8،9،10،11،12. على وجه الخصوص ، تم استخدام التعلم العميق على نطاق واسع في تحليل الصور الطبية ، وقد تم الإبلاغ عن طرق مختلفة لتقدير العمر من خلال تحليل الأشعة تلقائيًا لتحسين دقة وكفاءة تقدير العمر ١٣.14،15،16،17،18،19،20 . على سبيل المثال ، طور Halabi et al 13 خوارزمية للتعلم الآلي تعتمد على الشبكات العصبية التلافيفية (CNN) لتقدير عصر الهيكل العظمي باستخدام الصور الشعاعية لأيد الأطفال. تقترح هذه الدراسة نموذجًا يطبق التعلم الآلي على الصور الطبية وتظهر أن هذه الطرق يمكن أن تحسن دقة التشخيص. قدرت Li et al14 العمر من صور الأشعة السينية في الحوض باستخدام CNN التعلم العميق ومقارنتها مع نتائج الانحدار باستخدام تقدير مرحلة التعجر. وجدوا أن نموذج CNN التعلم العميق أظهر نفس أداء تقدير العمر مثل نموذج الانحدار التقليدي. قيمت دراسة Guo et al.
معظم الدراسات حول تقدير العمر باستخدام التعلم الآلي تستخدم طرق التعلم العميق 13،14،15،16،17،18،19،20. تم الإبلاغ عن تقدير العمر القائم على التعلم العميق ليكون أكثر دقة من الأساليب التقليدية. ومع ذلك ، فإن هذا النهج يوفر فرصة ضئيلة لتقديم الأساس العلمي لتقديرات العمر ، مثل المؤشرات العمرية المستخدمة في التقديرات. هناك أيضًا نزاع قانوني حول من يقوم بعمليات التفتيش. لذلك ، يصعب قبول تقدير العمر القائم على التعلم العميق من خلال السلطات الإدارية والقضائية. تعدين البيانات (DM) هو تقنية لا يمكنها اكتشاف المعلومات المتوقعة فحسب ، بل أيضًا معلومات غير متوقعة كوسيلة لاكتشاف ارتباطات مفيدة بين كميات كبيرة من البيانات 6،21،22. غالبًا ما يتم استخدام التعلم الآلي في استخراج البيانات ، ويستخدم كل من استخراج البيانات والتعلم الآلي نفس خوارزميات المفاتيح لاكتشاف الأنماط في البيانات. يعتمد التقدير العمري باستخدام تطوير الأسنان على تقييم الفاحص لنضج الأسنان المستهدفة ، ويتم التعبير عن هذا التقييم كمرحلة لكل أسنان مستهدفة. يمكن استخدام DM لتحليل العلاقة بين مرحلة تقييم الأسنان والعمر الفعلي ولديه القدرة على استبدال التحليل الإحصائي التقليدي. لذلك ، إذا قمنا بتطبيق تقنيات DM على تقدير العمر ، فيمكننا تنفيذ التعلم الآلي في تقدير عمر الطب الشرعي دون القلق بشأن المسؤولية القانونية. تم نشر العديد من الدراسات المقارنة على البدائل المحتملة للطرق اليدوية التقليدية المستخدمة في ممارسة الطب الشرعي والأساليب القائمة على EBM لتحديد عصر الأسنان. أظهر Shen et al23 أن نموذج DM أكثر دقة من صيغة المصور التقليدية. طبقت Galibourg et al24 أساليب DM مختلفة للتنبؤ بالسن وفقًا لمعايير Demirdjian 25 وأظهرت النتائج أن طريقة DM تفوقت على أساليب Demirdjian و Willems في تقدير عمر السكان الفرنسيين.
لتقدير عصر طب الأسنان للمراهقين الكوريين والشباب ، تستخدم طريقة Lee 4 على نطاق واسع في ممارسة الطب الشرعي الكوري. تستخدم هذه الطريقة التحليل الإحصائي التقليدي (مثل الانحدار المتعدد) لدراسة العلاقة بين الموضوعات الكورية والعمر الزمني. في هذه الدراسة ، يتم تعريف طرق تقدير العمر التي تم الحصول عليها باستخدام الطرق الإحصائية التقليدية على أنها "طرق تقليدية". طريقة Lee هي طريقة تقليدية ، وقد تم تأكيد دقتها من قبل Oh et al. 5 ؛ ومع ذلك ، فإن قابلية تطبيق تقدير العمر على أساس نموذج DM في ممارسة الطب الشرعي الكوري لا تزال قابلة للتشكيك. كان هدفنا هو التحقق من صحة الفائدة المحتملة لتقدير العمر بناءً على نموذج DM. كان الغرض من هذه الدراسة (1) مقارنة دقة نماذج DM في تقدير عمر الأسنان و (2) لمقارنة أداء تصنيف نماذج 7 DM في سن 18 عامًا مع تلك التي تم الحصول عليها باستخدام الأساليب الإحصائية التقليدية النضج للثانية والأضراس الثالثة في كل من الفكين.
يتم عرض الوسائل والانحرافات المعيارية للعمر الزمني حسب المرحلة ونوع الأسنان عبر الإنترنت في الجدول التكميلي S1 (مجموعة التدريب) ، والجدول التكميلي S2 (مجموعة الاختبار الداخلي) ، والجدول التكميلي S3 (مجموعة الاختبار الخارجي). وكانت قيم kappa للموثوقية داخل و interobserver التي تم الحصول عليها من مجموعة التدريب 0.951 و 0.947 ، على التوالي. يتم عرض قيم P وفواصل الثقة 95 ٪ لقيم KAPPA في الجدول التكميلي عبر الإنترنت S4. تم تفسير قيمة Kappa على أنها "مثالية تقريبًا" ، بما يتوافق مع معايير Landis و Koch26.
عند مقارنة الخطأ المطلق المتوسط (MAE) ، تتفوق الطريقة التقليدية قليلاً على نموذج DM لجميع الأجناس وفي مجموعة اختبار الذكور الخارجية ، باستثناء Perceptron متعدد الطبقات (MLP). كان الفرق بين النموذج التقليدي ونموذج DM في مجموعة اختبار MAE الداخلية 0.12-0.19 سنة للرجال و 0.17-0.21 سنة للنساء. بالنسبة لبطارية الاختبار الخارجية ، تكون الاختلافات أصغر (0.001–0.05 سنة للرجال و 0.05 - 0.09 سنة للنساء). بالإضافة إلى ذلك ، يكون الخطأ المربع المتوسط للجذر (RMSE) أقل قليلاً من الطريقة التقليدية ، مع اختلافات أصغر (0.17-0.24 ، 0.2-0.24 لمجموعة الاختبار الداخلي للذكور ، و 0.03-0.07 ، 0.04–0.08 لمجموعة الاختبار الخارجية). ). يُظهر MLP أداءً أفضل قليلاً من Perceptron طبقة واحدة (SLP) ، إلا في حالة مجموعة الاختبار الخارجية للإناث. بالنسبة إلى MAE و RMSE ، فإن مجموعة الاختبار الخارجية أعلى من الاختبار الداخلي المحدد لجميع الأجناس والنماذج. يتم عرض جميع MAE و RMSE في الجدول 1 والشكل 1.
Mae و RMSE من نماذج الانحدار التقليدية والتعدين للبيانات. يعني الخطأ المطلق MAE ، جذر متوسط خطأ مربع RMSE ، طبقة واحدة perceptron SLP ، MultIllayer Perceptron MLP ، طريقة CM التقليدية.
تم توضيح أداء التصنيف (مع قطع 18 عامًا) من النماذج التقليدية و DM من حيث الحساسية ، والخصوصية ، والقيمة التنبؤية الإيجابية (PPV) ، والقيمة التنبؤية السلبية (NPV) ، والمساحة الواقعة تحت منحنى مميزة تشغيل المتلقي (AUROC) 27 (الجدول 2 ، الشكل 2 والشكل التكميلي 1 عبر الإنترنت). فيما يتعلق بحساسية بطارية الاختبار الداخلية ، تم أداء الأساليب التقليدية بين الرجال والأسوأ بين النساء. ومع ذلك ، فإن الفرق في أداء التصنيف بين الأساليب التقليدية و SD هو 9.7 ٪ للرجال (MLP) و 2.4 ٪ فقط للنساء (XgBoost). بين نماذج DM ، أظهر الانحدار اللوجستي (LR) حساسية أفضل في كلا الجنسين. فيما يتعلق بخصوصية مجموعة الاختبار الداخلية ، لوحظ أن نماذج SD الأربعة كانت تعمل بشكل جيد في الذكور ، في حين أن النموذج التقليدي كان أفضل في الإناث. الاختلافات في أداء التصنيف للذكور والإناث هي 13.3 ٪ (MLP) و 13.1 ٪ (MLP) ، على التوالي ، مما يشير إلى أن الفرق في أداء التصنيف بين النماذج يتجاوز الحساسية. من بين نماذج DM ، تم أداء نماذج ناقلات الدعم (SVM) ، وشجرة القرار (DT) ، ونماذج الغابات العشوائية (RF) بشكل أفضل بين الذكور ، بينما كان نموذج LR أفضل بين الإناث. كان AUROC للنموذج التقليدي وجميع نماذج SD أكبر من 0.925 (K-Nearest Neighbor (KNN) في الرجال) ، مما يدل على أداء تصنيف ممتاز في التمييز على عينات عمرها 18 عامًا. بالنسبة لمجموعة الاختبار الخارجية ، كان هناك انخفاض في أداء التصنيف من حيث الحساسية والخصوصية و AUROC مقارنة بمجموعة الاختبار الداخلي. علاوة على ذلك ، تراوح الاختلاف في الحساسية والخصوصية بين أداء التصنيف لأفضل وأسوأ النماذج من 10 ٪ إلى 25 ٪ وكان أكبر من الفرق في مجموعة الاختبار الداخلية.
حساسية وخصوصية نماذج تصنيف تعدين البيانات مقارنة بالطرق التقليدية مع قطع 18 عامًا. KNN K أقرب جار ، SVM دعم المتجه ، LR LOGISTION REPRESS ، شجرة قرار DT ، RF Random Forest ، XGB XGBOOST ، MLP Multilayer Perceptron ، طريقة CM التقليدية.
كانت الخطوة الأولى في هذه الدراسة هي مقارنة دقة تقديرات سن الأسنان التي تم الحصول عليها من سبعة نماذج DM مع تلك التي تم الحصول عليها باستخدام الانحدار التقليدي. تم تقييم MAE و RMSE في مجموعات الاختبار الداخلي لكلا الجنسين ، وتراوحت الفرق بين الطريقة التقليدية ونموذج DM من 44 إلى 77 يومًا لـ MAE ومن 62 إلى 88 يومًا لـ RMSE. على الرغم من أن الطريقة التقليدية كانت أكثر دقة قليلاً في هذه الدراسة ، إلا أنه من الصعب استنتاج ما إذا كان هذا الاختلاف الصغير له أهمية سريرية أو عملية. تشير هذه النتائج إلى أن دقة تقدير سن الأسنان باستخدام نموذج DM هي نفسها تقريبًا مثل الطريقة التقليدية. من الصعب المقارنة المباشرة مع النتائج من الدراسات السابقة لأنه لم تقارن أي دراسة دقة نماذج DM مع الطرق الإحصائية التقليدية باستخدام نفس تقنية تسجيل الأسنان في نفس الفئة العمرية كما في هذه الدراسة. قارن Galibourg et al24 MAE و RMSE بين طريقتين تقليديتين (Method Demirjian Method25 و Willems Method29) و 10 نماذج DM في السكان الفرنسيين الذين تتراوح أعمارهم بين 2 و 24 عامًا. وذكروا أن جميع نماذج DM كانت أكثر دقة من الأساليب التقليدية ، مع اختلافات قدرها 0.20 و 0.38 سنة في MAE و 0.25 و 0.47 سنة في RMSE مقارنة مع أساليب Willems و Demirdjian ، على التوالي. يأخذ التناقض بين نموذج SD والطرق التقليدية الموضحة في دراسة Halibourg في الاعتبار العديد من التقارير 30،31،32،33 أن طريقة Demirdjian لا تقدر بدقة سن الأسنان في السكان بخلاف الكنديين الفرنسيين الذين استندت الدراسة التي استندت إليها الدراسة. في هذه الدراسة. استخدم Tai et al 34 خوارزمية MLP للتنبؤ بعمر الأسنان من 1636 صور تقويم الأسنان الصينية وقارنوا دقتها مع نتائج طريقة Demirjian و Willems. وذكروا أن MLP لديه دقة أعلى من الأساليب التقليدية. الفرق بين طريقة demirdjian والطريقة التقليدية هو <0.32 سنة ، وطريقة Willems هي 0.28 سنة ، وهو ما يشبه نتائج هذه الدراسة. تتوافق نتائج هذه الدراسات السابقة 24،34 مع نتائج هذه الدراسة الحالية ، ودقة تقدير العمر لنموذج DM والطريقة التقليدية متشابهة. ومع ذلك ، استنادًا إلى النتائج المقدمة ، لا يمكننا إلا أن نستنتج بحذر أن استخدام نماذج DM لتقدير العمر قد يحل محل الطرق الحالية بسبب عدم وجود دراسات سابقة مقارنة. هناك حاجة إلى دراسات المتابعة باستخدام عينات أكبر لتأكيد النتائج التي تم الحصول عليها في هذه الدراسة.
من بين الدراسات التي تختبر دقة SD في تقدير سن الأسنان ، أظهر بعضها دقة أعلى من دراستنا. قام Stepanovsky et al 35 بتطبيق نماذج SD 22 على الصور الشعاعية البانورامية من 976 من سكان التشيك الذين تتراوح أعمارهم بين 2.7 إلى 20.5 سنة واختبروا دقة كل نموذج. قاموا بتقييم تطور ما مجموعه 16 أسنانًا دائمة أعلى وأسفل اليسرى باستخدام معايير التصنيف التي اقترحتها Moorrees et al 36. يتراوح MAE من 0.64 إلى 0.94 سنة وتتراوح RMSE من 0.85 إلى 1.27 سنة ، والتي هي أكثر دقة من نموذجين DM المستخدمة في هذه الدراسة. استخدم Shen et al23 طريقة Cameriere لتقدير سن الأسنان من سبعة أسنان دائمة في الفك السفلي الأيسر عند السكان الصينيين الشرقيين الذين تتراوح أعمارهم بين 5 و 13 عامًا وقارنها مع الأعمار المقدرة باستخدام الانحدار الخطي و SVM و RF. لقد أظهروا أن جميع نماذج DM الثلاثة لها دقة أعلى مقارنة بصيغة الكاميرات التقليدية. كانت MAE و RMSE في دراسة Shen أقل من تلك الموجودة في نموذج DM في هذه الدراسة. زيادة دقة الدراسات التي كتبها ستيبانوفسكي وآخرون. 35 وشين وآخرون. 23 قد يكون بسبب إدراج الموضوعات الأصغر سنا في عينات دراستهم. نظرًا لأن تقديرات العمر للمشاركين الذين يعانون من نمو الأسنان تصبح أكثر دقة مع زيادة عدد الأسنان أثناء تطوير الأسنان ، فقد تتعرض دقة طريقة تقدير العمر الناتجة للخطر عندما يكون المشاركون في الدراسة أصغر سناً. بالإضافة إلى ذلك ، يكون خطأ MLP في تقدير العمر أصغر قليلاً من SLP ، مما يعني أن MLP أكثر دقة من SLP. يعتبر MLP أفضل قليلاً لتقدير العمر ، ربما بسبب الطبقات المخفية في MLP38. ومع ذلك ، هناك استثناء للعينة الخارجية من النساء (SLP 1.45 ، MLP 1.49). تتطلب اكتشاف أن MLP أكثر دقة من SLP في تقييم العمر يتطلب دراسات بأثر رجعي إضافي.
تمت مقارنة أداء تصنيف نموذج DM والطريقة التقليدية في عتبة 18 عامًا أيضًا. أظهرت جميع نماذج SD التي تم اختبارها والأساليب التقليدية في مجموعة الاختبار الداخلية مستويات مقبولة عمليا من التمييز للعينة التي يبلغ عمرها 18 عامًا. كانت حساسية الرجال والنساء أكبر من 87.7 ٪ و 94.9 ٪ ، على التوالي ، وكانت الخصوصية أكبر من 89.3 ٪ و 84.7 ٪. يتجاوز AUROC لجميع النماذج التي تم اختبارها 0.925. على حد علمنا ، لم تختبر أي دراسة أداء نموذج DM لتصنيف 18 عامًا على أساس نضج الأسنان. يمكننا مقارنة نتائج هذه الدراسة مع أداء تصنيف نماذج التعلم العميق على الصور الشعاعية البانورامية. حسبت Guo et al.15 أداء تصنيف نموذج التعلم العميق المستند إلى CNN وطريقة يدوية تعتمد على طريقة Demirjian لعتبة معينة في العمر. كانت حساسية وخصوصية الطريقة اليدوية 87.7 ٪ و 95.5 ٪ ، على التوالي ، وتجاوزت حساسية وخصوصية نموذج CNN 89.2 ٪ و 86.6 ٪ على التوالي. وخلصوا إلى أن نماذج التعلم العميقة يمكن أن تحل محل أو تتفوق على التقييم اليدوي في تصنيف عتبات العمر. أظهرت نتائج هذه الدراسة أداء تصنيف مماثل. يُعتقد أن التصنيف باستخدام نماذج DM يمكن أن يحل محل الطرق الإحصائية التقليدية لتقدير العمر. من بين النماذج ، كان DM LR أفضل نموذج من حيث حساسية العينة الذكرية والحساسية والخصوصية للعينة الأنثوية. LR يحتل المرتبة الثانية في خصوصية الرجال. علاوة على ذلك ، تعتبر LR واحدة من أكثر طرز DM35 سهلة الاستخدام وهي أقل تعقيدًا ويصعب معالجتها. بناءً على هذه النتائج ، كان يعتبر LR أفضل نموذج لتصنيف القطع للأطفال في سن 18 عامًا في السكان الكوريين.
بشكل عام ، كانت دقة تقدير العمر أو أداء التصنيف على مجموعة الاختبار الخارجية سيئة أو أقل مقارنة بالنتائج في مجموعة الاختبار الداخلية. تشير بعض التقارير إلى أن دقة التصنيف أو الكفاءة تتناقص عندما يتم تطبيق تقديرات العمر على أساس السكان الكوريين على السكان اليابانيين 5،39 ، وتم العثور على نمط مماثل في الدراسة الحالية. ولوحظ هذا الاتجاه التدهور أيضًا في نموذج DM. لذلك ، لتقدير العمر بدقة ، حتى عند استخدام DM في عملية التحليل ، ينبغي تفضيل الأساليب المستمدة من بيانات السكان الأصلية ، مثل الطرق التقليدية ، 5،39،40،41،42. نظرًا لأنه من غير الواضح ما إذا كانت نماذج التعلم العميق يمكن أن تظهر اتجاهات مماثلة ، فإن الدراسات التي تقارن دقة التصنيف والكفاءة باستخدام الأساليب التقليدية ونماذج DM ونماذج التعلم العميق على نفس العينات مطلوبة لتأكيد ما إذا كان يمكن للذكاء الاصطناعي التغلب على هذه التباينات العنصرية في العمر المحدود. التقييمات.
نوضح أنه يمكن استبدال الأساليب التقليدية بتقدير العمر بناءً على نموذج DM في ممارسة تقدير عمر الطب الشرعي في كوريا. اكتشفنا أيضًا إمكانية تنفيذ التعلم الآلي لتقييم عمر الطب الشرعي. ومع ذلك ، هناك قيود واضحة ، مثل العدد غير الكافي من المشاركين في هذه الدراسة لتحديد النتائج بشكل قاطع ، وعدم وجود دراسات سابقة لمقارنة وتأكيد نتائج هذه الدراسة. في المستقبل ، ينبغي إجراء دراسات DM مع أعداد أكبر من العينات والسكان الأكثر تنوعًا لتحسين قابليتها للتطبيق العملي مقارنة بالطرق التقليدية. للتحقق من جدوى استخدام الذكاء الاصطناعي لتقدير العمر في العديد من السكان ، هناك حاجة إلى دراسات مستقبلية لمقارنة دقة التصنيف وكفاءة نماذج DM ونماذج التعلم العميق مع الأساليب التقليدية في نفس العينات.
استخدمت الدراسة 2،657 صورة إملائية تم جمعها من البالغين الكوريين واليابانيين الذين تتراوح أعمارهم بين 15 و 23 عامًا. تم تقسيم الصور الشعاعية الكورية إلى 900 مجموعة تدريب (19.42 ± 2.65 سنة) و 900 مجموعة اختبار داخلية (19.52 ± 2.59 سنة). تم جمع مجموعة التدريب في مؤسسة واحدة (مستشفى سيول سانت ماري) ، وتم جمع مجموعة الاختبار الخاصة في مؤسستين (مستشفى جامعة سيول الوطني للأسنان ومستشفى جامعة يونيسي). جمعنا أيضًا 857 صورًا شعاعيةًا من بيانات أخرى قائمة على السكان (جامعة إيوات الطبية ، اليابان) للاختبار الخارجي. تم اختيار الصور الشعاعية للمواضيع اليابانية (19.31 ± 2.60 سنة) كمجموعة اختبار خارجية. تم جمع البيانات بأثر رجعي لتحليل مراحل تطوير الأسنان على الصور الشعاعية البانورامية التي تم أخذها أثناء علاج الأسنان. كانت جميع البيانات التي تم جمعها مجهول الهوية باستثناء الجنس وتاريخ الميلاد وتاريخ التصوير الشعاعي. كانت معايير التضمين والاستبعاد هي نفسها كما سبق نشرها الدراسات 4 ، 5. تم حساب العمر الفعلي للعينة عن طريق طرح تاريخ الميلاد من تاريخ أخذ الأشعة. تم تقسيم مجموعة العينة إلى تسع فئات عمرية. يظهر توزيعات العمر والجنس في الجدول 3 أجريت هذه الدراسة وفقًا لإعلان هلسنكي وتمت الموافقة عليه من قبل مجلس المراجعة المؤسسية (IRB) لمستشفى سيول سانت ماري بجامعة كوريا الكاثوليكية (KC22WISI0328). بسبب التصميم بأثر رجعي لهذه الدراسة ، لا يمكن الحصول على موافقة مستنيرة من جميع المرضى الذين يخضعون للفحص الشعاعي لأغراض علاجية. تنازل مستشفى جامعة سانت ماري (IRB) بجامعة سول كوريا عن شرط الموافقة المستنيرة.
تم تقييم المراحل التنموية من الأضراس الثانية والثالثة bimaxillary وفقا لمعايير Demircan 25. تم اختيار سن واحد فقط إذا تم العثور على نفس النوع من الأسنان على الجانبين الأيسر واليمين من كل فك. إذا كانت الأسنان المتماثلة على كلا الجانبين في مراحل تنموية مختلفة ، فقد تم اختيار الأسنان ذات المرحلة التنموية المنخفضة لحساب عدم اليقين في العمر المقدر. تم تسجيل مائة مصور شعاعي تم اختياره عشوائيًا من مجموعة التدريب من قبل مراقبين من ذوي الخبرة لاختبار موثوقية interobserver بعد المعايرة المسبقة لتحديد مرحلة نضج الأسنان. تم تقييم موثوقية intraobserver مرتين على فترات ثلاثة أشهر من قبل المراقب الأساسي.
تم تقدير المرحلة الجنسية والتنموية من الأضراس الثانية والثالثة لكل فك في مجموعة التدريب من قبل مراقب أولي مدرب مع نماذج DM مختلفة ، وتم تعيين العمر الفعلي كقيمة مستهدفة. تم اختبار نماذج SLP و MLP ، والتي يتم استخدامها على نطاق واسع في التعلم الآلي ، ضد خوارزميات الانحدار. يجمع نموذج DM بين الوظائف الخطية باستخدام المراحل التنموية للأسنان الأربعة ويجمع هذه البيانات لتقدير العمر. SLP هي أبسط شبكة عصبية ولا تحتوي على طبقات مخفية. تعمل SLP على أساس انتقال العتبة بين العقد. يشبه نموذج SLP في الانحدار رياضياً الانحدار الخطي المتعدد. على عكس نموذج SLP ، يحتوي طراز MLP على طبقات مخفية متعددة مع وظائف التنشيط غير الخطية. استخدمت تجاربنا طبقة مخفية مع 20 عقدًا مخفيًا فقط مع وظائف التنشيط غير الخطية. استخدم نزول التدرج كطريقة تحسين و MAE و RMSE كدالة الخسارة لتدريب نموذج التعلم الآلي لدينا. تم تطبيق أفضل نموذج الانحدار الذي تم الحصول عليه على مجموعات الاختبار الداخلية والخارجية وتم تقدير عمر الأسنان.
تم تطوير خوارزمية تصنيف تستخدم نضج أربعة أسنان على التدريب للتنبؤ بما إذا كانت العينة عمرها 18 عامًا أم لا. لبناء النموذج ، استخلصنا سبعة خوارزميات التعلم الآلي 6،43: (1) LR ، (2) KNN ، (3) SVM ، (4) DT ، (5) RF ، (6) XgBoost ، و (7) MLP . LR هي واحدة من خوارزميات التصنيف الأكثر استخدامًا على نطاق واسع 44. إنها خوارزمية تعليمية خاضعة للإشراف تستخدم الانحدار للتنبؤ باحتمال البيانات التي تنتمي إلى فئة معينة من 0 إلى 1 وتصنيف البيانات على أنها تنتمي إلى فئة أكثر احتمالًا بناءً على هذا الاحتمال ؛ يستخدم بشكل رئيسي للتصنيف الثنائي. KNN هي واحدة من أبسط خوارزميات التعلم الآلي 45. عند إعطاء بيانات إدخال جديدة ، يجد بيانات K قريبة من المجموعة الحالية ثم تصنفها في الفصل بأعلى تردد. حددنا 3 لعدد الجيران الذين يعتبرون (ك). SVM هي خوارزمية تزيد من المسافة بين فئتين باستخدام وظيفة kernel لتوسيع المساحة الخطية إلى مساحة غير خطية تسمى Fields46. لهذا النموذج ، نستخدم التحيز = 1 ، الطاقة = 1 ، و gamma = 1 كفرط في نواة الحدود. تم تطبيق DT في مختلف الحقول كخوارزمية لتقسيم مجموعة البيانات بأكملها إلى عدة مجموعات فرعية من خلال تمثيل قواعد القرار في هيكل شجرة 47. تم تكوين النموذج مع الحد الأدنى لعدد السجلات لكل عقدة 2 ويستخدم فهرس جيني كمقياس للجودة. RF هي طريقة فرقة تجمع بين DTs متعددة لتحسين الأداء باستخدام طريقة تجميع bootstrap التي تنشئ مصنفًا ضعيفًا لكل عينة عن طريق رسم عينات عشوائية من نفس الحجم عدة مرات من مجموعة البيانات الأصلية. استخدمنا 100 شجرة ، 10 أعماق شجرة ، 1 الحد الأدنى لحجم العقدة ، ومؤشر جيني ملجأ كمعايير فصل العقدة. يتم تحديد تصنيف البيانات الجديدة من خلال تصويت الأغلبية. XgBoost هي خوارزمية تجمع بين تقنيات التعزيز باستخدام طريقة تأخذ كبيانات تدريب ، الخطأ بين القيم الفعلية والمتوقعة للنموذج السابق ويزيد من الخطأ باستخدام التدرجات 49. إنها خوارزمية تستخدم على نطاق واسع نظرًا لأدائها الجيد وكفاءة الموارد ، بالإضافة إلى موثوقية عالية كدالة تصحيح ملائمة. تم تجهيز النموذج بـ 400 عجلات دعم. MLP هي شبكة عصبية حيث تشكل إدراكي واحد أو أكثر طبقات متعددة مع طبقة واحدة أو أكثر من الطبقات المخفية بين طبقات الإدخال والمخرجات 38. باستخدام هذا ، يمكنك تنفيذ تصنيف غير خطي حيث عند إضافة طبقة إدخال والحصول على قيمة نتيجة ، تتم مقارنة قيمة النتيجة المتوقعة بقيمة النتيجة الفعلية ويتم نشر الخطأ مرة أخرى. أنشأنا طبقة مخفية مع 20 الخلايا العصبية المخفية في كل طبقة. تم تطبيق كل نموذج قمنا بتطويره على مجموعات داخلية وخارجية لاختبار أداء التصنيف من خلال حساب الحساسية والخصوصية و PPV و NPV و AUROC. يتم تعريف الحساسية على أنها نسبة عينة تقدر أن تبلغ من العمر 18 عامًا أو أكبر لعينة تقدر أن تبلغ من العمر 18 عامًا أو أكبر. الخصوصية هي نسبة العينات التي تقل عن 18 عامًا وتلك التي تقدر بأعمار عمرها 18 عامًا.
تم تحويل مراحل الأسنان التي تم تقييمها في مجموعة التدريب إلى مراحل رقمية للتحليل الإحصائي. تم إجراء الانحدار الخطي واللوجستي متعدد المتغيرات لتطوير نماذج تنبؤية لكل جنس واشتقاق صيغ الانحدار التي يمكن استخدامها لتقدير العمر. استخدمنا هذه الصيغ لتقدير عمر الأسنان لكل من مجموعات الاختبار الداخلية والخارجية. يوضح الجدول 4 نماذج الانحدار والتصنيف المستخدمة في هذه الدراسة.
تم حساب موثوقية intra- و interobserver باستخدام إحصاء كوهين كابا. لاختبار دقة DM ونماذج الانحدار التقليدية ، قمنا بحساب MAE و RMSE باستخدام الأعمار المقدرة والفعلية لمجموعات الاختبار الداخلية والخارجية. تُستخدم هذه الأخطاء بشكل شائع لتقييم دقة تنبؤات النموذج. كلما كان الخطأ أصغر ، كلما زادت دقة التنبؤ 24. قارن MAE و RMSE لمجموعات الاختبار الداخلية والخارجية المحسوبة باستخدام DM والانحدار التقليدي. تم تقييم أداء تصنيف القطع لمدة 18 عامًا في الإحصاءات التقليدية باستخدام جدول طوارئ 2 × 2. تمت مقارنة الحساسية المحسوبة ، والخصوصية ، و PPV ، و NPV ، و AUROC لمجموعة الاختبار مع القيم المقاسة لنموذج تصنيف DM. يتم التعبير عن البيانات على أنها متوسط الانحراف المعياري أو العدد (٪) اعتمادًا على خصائص البيانات. واعتبرت القيم p ثنائية الجوانب <0.05 ذات دلالة إحصائية. تم إجراء جميع التحليلات الإحصائية الروتينية باستخدام SAS الإصدار 9.4 (معهد SAS ، Cary ، NC). تم تنفيذ نموذج الانحدار DM في Python باستخدام Keras50 2.2.4 الواجهة الخلفية و TensorFlow51 1.8.0 خصيصًا للعمليات الرياضية. تم تنفيذ نموذج تصنيف DM في بيئة تحليل المعرفة Waikato ومنصة تحليل Konstanz Information (Knime) 4.6.152.
يقر المؤلفون بأن البيانات التي تدعم استنتاجات الدراسة يمكن العثور عليها في المقالة والمواد التكميلية. تتوفر مجموعات البيانات التي تم إنشاؤها و/أو تحليلها أثناء الدراسة من المؤلف المقابل بناءً على طلب معقول.
Ritz-Timme ، S. et al. التقييم العمري: أحدث ما يقتضى لتلبية المتطلبات المحددة لممارسة الطب الشرعي. الدولية. J. الطب القانوني. 113 ، 129-136 (2000).
Schmeling ، A. ، Reisinger ، W. ، Geserik ، G. ، and Olze ، A. الوضع الحالي للتقييم العمري الجنائي للمواد الحية لأغراض الادعاء الجنائي. الطب الشرعي. الدواء. علم الأمراض. 1 ، 239-246 (2005).
Pan ، J. et al. طريقة معدلة لتقييم عمر طب الأسنان للأطفال الذين تتراوح أعمارهم بين 5 و 16 عامًا في شرق الصين. سريري. مسح عن طريق الفم. 25 ، 3463–3474 (2021).
Lee ، SS إلخ. التسلسل الزمني لتطوير الأضراس الثانية والثالثة في الكوريين وتطبيقها على تقييم عمر الطب الشرعي. الدولية. J. الطب القانوني. 124 ، 659–665 (2010).
Oh ، S. ، Kumagai ، A. ، Kim ، Sy and Lee ، دقة SS لتقدير العمر وتقدير عتبة 18 عامًا بناءً على نضج الأضراس الثانية والثالثة في الكوريين واليابانيين. PLOS One 17 ، E0271247 (2022).
كيم ، جي ، وآخرون. يمكن أن يتنبأ تحليل البيانات القائم على التعلم الآلي قبل الجراحة نتائج علاج جراحة النوم في المرضى الذين يعانون من OSA. العلم. تقرير 11 ، 14911 (2021).
هان ، م. وآخرون. تقدير العمر الدقيق من التعلم الآلي مع أو بدون تدخل بشري؟ الدولية. J. الطب القانوني. 136 ، 821–831 (2022).
خان ، س. وشاهين ، م. من تعدين البيانات إلى تعدين البيانات. J.Information. العلم. https://doi.org/10.1177/01655515211030872 (2021).
خان ، س. وشاهين ، م. ويسرول: أول خوارزمية إدراكية لاتخاذ تعدين قاعدة الجمعيات. J.Information. العلم. https://doi.org/10.1177/01655515221108695 (2022).
شاهين م. وعبد الله U. كارم: تعدين البيانات التقليدية على أساس قواعد الارتباط القائمة على السياق. حساب. مات. يكمل. 68 ، 3305–3322 (2021).
Muhammad M. ، رحمن ز. ، شاهين م. يخبر. التقنيات. يتحكم. https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish ، M. ، Tanoli ، Z. ، and Shahin ، M. نظام للتعرف على النشاط في مقاطع الفيديو الرياضية. الوسائط المتعددة. أدوات تطبيقات https://doi.org/10.1007/S11042-021-10519-6 (2021).
Halabi ، SS et al. RSNA تحدي التعلم الآلي في عصر عظم الأطفال. الأشعة 290 ، 498-503 (2019).
لي ، ي. وآخرون. التقدير العمري الشرعي من الأشعة السينية الحوضية باستخدام التعلم العميق. اليورو. إشعاع. 29 ، 2322–2329 (2019).
Guo ، YC ، وآخرون. التصنيف العمري الدقيق باستخدام الأساليب اليدوية والشبكات العصبية التلافيفية العميقة من صور الإسقاط الإملائي. الدولية. J. الطب القانوني. 135 ، 1589-1597 (2021).
ألاباما دالورا وآخرون. تقدير عمر العظام باستخدام طرق التعلم الآلي المختلفة: مراجعة الأدب المنهجية والتحليل التلوي. PLOS One 14 ، E0220242 (2019).
Du ، H. ، Li ، G. ، Cheng ، K. ، and Yang ، J. التقدير العمري الخاص بالسكان للأميركيين الأفارقة والصينيين على أساس أحجام غرفة اللب من الأضراس الأولى باستخدام التصوير المقطعي المخروطي. الدولية. J. الطب القانوني. 136 ، 811–819 (2022).
كيم س. العلم. تقرير 11 ، 1073 (2021).
Stern ، D. ، Dearer ، C. ، Giuliani ، N. ، and Urschler ، M. Automatic Age Education and Gurdary Age Tensing of Multivariate MRI Data. IEEE J. Biomed. التنبيهات الصحية. 23 ، 1392-1403 (2019).
Cheng ، Q. ، GE ، Z. ، Du ، H. and Li ، G. تقدير العمر على أساس تجزئة غرفة اللب ثلاثية الأبعاد للأضراس الأولى من التصوير المقطعي المحسوب من خلال دمج مجموعات التعلم العميق والمستوى. الدولية. J. الطب القانوني. 135 ، 365–373 (2021).
Wu ، WT ، وآخرون. استخراج البيانات في البيانات الكبيرة السريرية: قواعد البيانات والخطوات والأساليب الشائعة. عالم. الدواء. الموارد. 8 ، 44 (2021).
يانغ ، ج. وآخرون. مقدمة لقواعد البيانات الطبية وتقنيات استخراج البيانات في عصر البيانات الضخمة. ج. الطب الأساسي. 13 ، 57-69 (2020).
شين ، س. وآخرون. طريقة Camerer لتقدير عمر الأسنان باستخدام التعلم الآلي. BMC Oral Health 21 ، 641 (2021).
Galliburg A. et al. مقارنة بين طرق التعلم الآلي المختلفة للتنبؤ بعمر الأسنان باستخدام طريقة التدريج demirdjian. الدولية. J. الطب القانوني. 135 ، 665–675 (2021).
Demirdjian ، A. ، Goldstein ، H. and Tanner ، JM نظام جديد لتقييم عصر الأسنان. شخير. علم الأحياء. 45 ، 211–227 (1973).
Landis ، Jr ، and Koch ، GG مقاييس اتفاق المراقب على البيانات الفئوية. القياسات الحيوية 33 ، 159-174 (1977).
Bhattacharjee S ، Prakash D ، Kim C ، Kim HK and Choi HK. التحليل النصي ، المورفولوجي والإحصائي للتصوير بالرنين المغناطيسي ثنائي الأبعاد باستخدام تقنيات الذكاء الاصطناعي لتمايز أورام الدماغ الأولية. المعلومات الصحية. الموارد. https://doi.org/10.4258/hir.2022.28.1.46 (2022).

وقت النشر: يناير -04-2024

التحقق من صحة نموذج استخراج البيانات ضد أساليب تقدير سن الأسنان التقليدية بين المراهقين الكوريين والشباب