• نحن

التحقق من صحة نموذج استخراج البيانات مقابل الطرق التقليدية لتقدير عمر الأسنان بين المراهقين والشباب الكوريين

شكرا لكم لزيارة Nature.com.إصدار المتصفح الذي تستخدمه لديه دعم محدود لـ CSS.للحصول على أفضل النتائج، نوصي باستخدام إصدار أحدث من متصفحك (أو إيقاف تشغيل وضع التوافق في Internet Explorer).في هذه الأثناء، ولضمان الدعم المستمر، نعرض الموقع بدون تصميم أو جافا سكريبت.
تعتبر الأسنان المؤشر الأكثر دقة لعمر جسم الإنسان وغالباً ما تستخدم في تقييم العمر في الطب الشرعي.نحن نهدف إلى التحقق من صحة تقديرات عمر الأسنان المستندة إلى استخراج البيانات من خلال مقارنة دقة التقدير وأداء التصنيف لعتبة 18 عامًا مع الطرق التقليدية وتقديرات العمر المستندة إلى استخراج البيانات.تم جمع ما مجموعه 2657 صورة شعاعية بانورامية لمواطنين كوريين ويابانيين تتراوح أعمارهم بين 15 إلى 23 عامًا.وتم تقسيمهم إلى مجموعة تدريب تحتوي كل منها على 900 صورة شعاعية كورية، ومجموعة اختبار داخلية تحتوي على 857 صورة شعاعية يابانية.قمنا بمقارنة دقة التصنيف وكفاءة الطرق التقليدية مع مجموعات اختبار نماذج استخراج البيانات.دقة الطريقة التقليدية في مجموعة الاختبار الداخلي أعلى قليلاً من دقة نموذج استخراج البيانات، والفرق صغير (متوسط ​​الخطأ المطلق <0.21 سنة، جذر متوسط ​​مربع الخطأ <0.24 سنة).يتشابه أيضًا أداء التصنيف للقطع لمدة 18 عامًا بين الطرق التقليدية ونماذج استخراج البيانات.وبالتالي، يمكن استبدال الأساليب التقليدية بنماذج استخراج البيانات عند إجراء تقييم العمر الشرعي باستخدام نضج الأضراس الثانية والثالثة لدى المراهقين والشباب الكوريين.
يستخدم تقدير عمر الأسنان على نطاق واسع في الطب الشرعي وطب أسنان الأطفال.على وجه الخصوص، بسبب الارتباط العالي بين العمر الزمني وتطور الأسنان، يعد تقييم العمر حسب مراحل نمو الأسنان معيارًا مهمًا لتقييم عمر الأطفال والمراهقين.ومع ذلك، بالنسبة للشباب، فإن تقدير عمر الأسنان على أساس نضج الأسنان له حدوده لأن نمو الأسنان يكاد يكون مكتملًا، باستثناء الأضراس الثالثة.الغرض القانوني من تحديد عمر الشباب والمراهقين هو تقديم تقديرات دقيقة وأدلة علمية تثبت ما إذا كانوا قد بلغوا سن الرشد.في الممارسة الطبية القانونية للمراهقين والشباب في كوريا، تم تقدير العمر باستخدام طريقة لي، وتم التنبؤ بالعتبة القانونية البالغة 18 عامًا بناءً على البيانات التي أبلغ عنها Oh et al 5 .
التعلم الآلي هو نوع من الذكاء الاصطناعي (AI) الذي يتعلم بشكل متكرر ويصنف كميات كبيرة من البيانات، ويحل المشكلات من تلقاء نفسه، ويقود برمجة البيانات.يمكن للتعلم الآلي اكتشاف أنماط مخفية مفيدة في كميات كبيرة من البيانات6.في المقابل، قد يكون للطرق الكلاسيكية، التي تتطلب عمالة كثيفة وتستغرق وقتًا طويلاً، قيودًا عند التعامل مع كميات كبيرة من البيانات المعقدة التي يصعب معالجتها يدويًا.لذلك، تم إجراء العديد من الدراسات مؤخرًا باستخدام أحدث تقنيات الكمبيوتر لتقليل الأخطاء البشرية ومعالجة البيانات متعددة الأبعاد بكفاءة8،9،10،11،12.على وجه الخصوص، تم استخدام التعلم العميق على نطاق واسع في تحليل الصور الطبية، وتم الإبلاغ عن طرق مختلفة لتقدير العمر من خلال التحليل التلقائي للصور الشعاعية لتحسين دقة وكفاءة تقدير العمر13،14،15،16،17،18،19،20 .على سبيل المثال، طور حلبي وزملاؤه 13 خوارزمية للتعلم الآلي تعتمد على الشبكات العصبية التلافيفية (CNN) لتقدير عمر الهيكل العظمي باستخدام الصور الشعاعية لأيدي الأطفال.تقترح هذه الدراسة نموذجًا يطبق التعلم الآلي على الصور الطبية، وتبين أن هذه الأساليب يمكن أن تحسن دقة التشخيص.قام لي وآخرون بتقدير العمر من صور الأشعة السينية للحوض باستخدام CNN للتعلم العميق ومقارنتها بنتائج الانحدار باستخدام تقدير مرحلة التعظم.ووجدوا أن نموذج CNN للتعلم العميق أظهر نفس أداء تقدير العمر مثل نموذج الانحدار التقليدي.قامت دراسة Guo et al. [15] بتقييم أداء تصنيف تحمل العمر لتقنية CNN استنادًا إلى الصور التقويمية للأسنان، وأثبتت نتائج نموذج CNN أن البشر تفوقوا على أداء التصنيف العمري.
تستخدم معظم الدراسات حول تقدير العمر باستخدام التعلم الآلي أساليب التعلم العميق13،14،15،16،17،18،19،20.تم الإبلاغ عن أن تقدير العمر بناءً على التعلم العميق أكثر دقة من الطرق التقليدية.ومع ذلك، فإن هذا النهج لا يوفر فرصة كبيرة لتقديم الأساس العلمي لتقديرات العمر، مثل مؤشرات العمر المستخدمة في التقديرات.هناك أيضًا نزاع قانوني حول من يقوم بعمليات التفتيش.ولذلك، فإن تقدير العمر على أساس التعلم العميق يصعب قبوله من قبل السلطات الإدارية والقضائية.يعد استخراج البيانات (DM) تقنية يمكنها اكتشاف ليس فقط المعلومات المتوقعة ولكن أيضًا المعلومات غير المتوقعة كوسيلة لاكتشاف الارتباطات المفيدة بين كميات كبيرة من البيانات6،21،22.غالبًا ما يستخدم التعلم الآلي في استخراج البيانات، ويستخدم كل من استخراج البيانات والتعلم الآلي نفس الخوارزميات الرئيسية لاكتشاف الأنماط في البيانات.يعتمد تقدير العمر باستخدام تطور الأسنان على تقييم الفاحص لمدى نضج الأسنان المستهدفة، ويتم التعبير عن هذا التقييم كمرحلة لكل سن مستهدف.يمكن استخدام DM لتحليل العلاقة بين مرحلة تقييم الأسنان والعمر الفعلي ولديه القدرة على استبدال التحليل الإحصائي التقليدي.لذلك، إذا طبقنا تقنيات DM على تقدير العمر، فيمكننا تنفيذ التعلم الآلي في تقدير العمر الشرعي دون القلق بشأن المسؤولية القانونية.تم نشر العديد من الدراسات المقارنة حول البدائل الممكنة للطرق اليدوية التقليدية المستخدمة في ممارسة الطب الشرعي والأساليب القائمة على الطب المبني على أساس الطب لتحديد عمر الأسنان.أظهر Shen et al أن نموذج DM أكثر دقة من صيغة Camerer التقليدية.قام Galibourg et al24 بتطبيق طرق DM مختلفة للتنبؤ بالعمر وفقًا لمعيار Demirdjian وأظهرت النتائج أن طريقة DM تفوقت على طرق Demirdjian وWillems في تقدير عمر السكان الفرنسيين.
لتقدير عمر الأسنان لدى المراهقين والشباب الكوريين، تُستخدم طريقة لي 4 على نطاق واسع في ممارسة الطب الشرعي الكوري.تستخدم هذه الطريقة التحليل الإحصائي التقليدي (مثل الانحدار المتعدد) لفحص العلاقة بين الأشخاص الكوريين والعمر الزمني.في هذه الدراسة، تم تعريف طرق تقدير العمر التي تم الحصول عليها باستخدام الطرق الإحصائية التقليدية على أنها "الطرق التقليدية".طريقة لي هي طريقة تقليدية، وقد تم تأكيد دقتها من قبل أوه وآخرون.5؛ومع ذلك، فإن إمكانية تطبيق تقدير العمر بناءً على نموذج DM في ممارسة الطب الشرعي الكوري لا يزال موضع شك.كان هدفنا هو التحقق علميًا من الفائدة المحتملة لتقدير العمر بناءً على نموذج DM.كان الغرض من هذه الدراسة (1) لمقارنة دقة نموذجين DM في تقدير عمر الأسنان و (2) لمقارنة أداء التصنيف لنماذج 7 DM في عمر 18 عامًا مع تلك التي تم الحصول عليها باستخدام الطرق الإحصائية التقليدية. والأضراس الثالثة في كلا الفكين.
يتم عرض المتوسطات والانحرافات المعيارية للعمر الزمني حسب المرحلة ونوع السن عبر الإنترنت في الجدول التكميلي S1 (مجموعة التدريب)، والجدول التكميلي S2 (مجموعة الاختبار الداخلي)، والجدول التكميلي S3 (مجموعة الاختبار الخارجية).كانت قيم كابا للموثوقية داخل وبين المراقبين التي تم الحصول عليها من مجموعة التدريب 0.951 و0.947 على التوالي.يتم عرض قيم P وفترات الثقة 95٪ لقيم kappa في الجدول الإضافي عبر الإنترنت S4.تم تفسير قيمة كابا على أنها "شبه مثالية"، بما يتوافق مع معايير لانديس وكوخ26.
عند مقارنة متوسط ​​الخطأ المطلق (MAE)، تتفوق الطريقة التقليدية قليلاً على نموذج DM لجميع الجنسين وفي مجموعة اختبار الذكور الخارجية، باستثناء الإدراك الحسي متعدد الطبقات (MLP).كان الفرق بين النموذج التقليدي ونموذج DM في مجموعة اختبار MAE الداخلية هو 0.12-0.19 سنة للرجال و0.17-0.21 سنة للنساء.بالنسبة لبطارية الاختبار الخارجية، تكون الاختلافات أصغر (0.001-0.05 سنة للرجال و0.05-0.09 سنة للنساء).بالإضافة إلى ذلك، فإن جذر متوسط ​​مربع الخطأ (RMSE) أقل قليلاً من الطريقة التقليدية، مع اختلافات أصغر (0.17-0.24، 0.2-0.24 لمجموعة الاختبار الداخلي للذكور، و0.03-0.07، 0.04-0.08 لمجموعة الاختبار الخارجي).).يُظهر MLP أداءً أفضل قليلاً من Single Layer Perceptron (SLP)، باستثناء حالة مجموعة الاختبار الخارجية الأنثوية.بالنسبة لـ MAE وRMSE، فإن مجموعة الاختبار الخارجي تحقق درجات أعلى من مجموعة الاختبار الداخلي لجميع الأجناس والنماذج.يتم عرض جميع MAE وRMSE في الجدول 1 والشكل 1.
MAE وRMSE لنماذج الانحدار التقليدية واستخراج البيانات.متوسط ​​الخطأ المطلق MAE، جذر متوسط ​​مربع الخطأ RMSE، الإدراك الحسي ذو الطبقة الواحدة SLP، الإدراك الحسي متعدد الطبقات MLP، طريقة CM التقليدية.
تم توضيح أداء التصنيف (مع انقطاع لمدة 18 عامًا) للنماذج التقليدية ونماذج DM من حيث الحساسية والنوعية والقيمة التنبؤية الإيجابية (PPV) والقيمة التنبؤية السلبية (NPV) والمنطقة الواقعة تحت منحنى خاصية تشغيل المستقبِل (AUROC). 27 (الجدول 2، الشكل 2 والشكل التكميلي 1 على الإنترنت).ومن حيث حساسية بطارية الاختبار الداخلية، كان أداء الطرق التقليدية أفضل بين الرجال وأسوأ بين النساء.ومع ذلك، فإن الفرق في أداء التصنيف بين الطرق التقليدية وSD هو 9.7% للرجال (MLP) و2.4% فقط للنساء (XGBoost).من بين نماذج DM، أظهر الانحدار اللوجستي (LR) حساسية أفضل في كلا الجنسين.وفيما يتعلق بخصوصية مجموعة الاختبارات الداخلية، فقد لوحظ أن نماذج SD الأربعة كان أداؤها جيداً عند الذكور، بينما كان أداء النموذج التقليدي أفضل عند الإناث.تبلغ الفروق في أداء التصنيف للذكور والإناث 13.3% (MLP) و13.1% (MLP) على التوالي، مما يشير إلى أن الاختلاف في أداء التصنيف بين النماذج يتجاوز الحساسية.من بين نماذج DM، كان أداء نماذج آلة ناقل الدعم (SVM)، وشجرة القرار (DT)، والغابات العشوائية (RF) أفضل بين الذكور، بينما كان أداء نموذج LR أفضل بين الإناث.كان AUROC للنموذج التقليدي وجميع نماذج SD أكبر من 0.925 (أقرب جار (KNN) عند الرجال)، مما يدل على أداء تصنيف ممتاز في تمييز العينات البالغة من العمر 18 عامًا .بالنسبة لمجموعة الاختبارات الخارجية، كان هناك انخفاض في أداء التصنيف من حيث الحساسية والنوعية وAUROC مقارنة بمجموعة الاختبارات الداخلية.علاوة على ذلك، تراوح الفرق في الحساسية والنوعية بين أداء التصنيف لأفضل النماذج وأسوأها من 10% إلى 25% وكان أكبر من الفرق في مجموعة الاختبارات الداخلية.
حساسية وخصوصية نماذج تصنيف استخراج البيانات مقارنة بالطرق التقليدية بفاصل زمني قدره 18 عامًا.أقرب جار KNN k، آلة ناقل دعم SVM، الانحدار اللوجستي LR، شجرة قرار DT، غابة RF العشوائية، XGB XGBoost، MLP متعدد الطبقات الإدراكي، طريقة CM التقليدية.
كانت الخطوة الأولى في هذه الدراسة هي مقارنة دقة تقديرات عمر الأسنان التي تم الحصول عليها من سبعة نماذج DM مع تلك التي تم الحصول عليها باستخدام الانحدار التقليدي.تم تقييم MAE وRMSE في مجموعات اختبار داخلية لكلا الجنسين، وتراوح الفرق بين الطريقة التقليدية ونموذج DM من 44 إلى 77 يومًا لـ MAE ومن 62 إلى 88 يومًا لـ RMSE.على الرغم من أن الطريقة التقليدية كانت أكثر دقة قليلاً في هذه الدراسة، فمن الصعب استنتاج ما إذا كان مثل هذا الاختلاف البسيط له أهمية سريرية أو عملية.تشير هذه النتائج إلى أن دقة تقدير عمر الأسنان باستخدام نموذج DM هي تقريبًا نفس دقة الطريقة التقليدية.من الصعب إجراء مقارنة مباشرة مع نتائج الدراسات السابقة لأنه لم تقم أي دراسة بمقارنة دقة نماذج DM مع الطرق الإحصائية التقليدية باستخدام نفس تقنية تسجيل الأسنان في نفس الفئة العمرية كما في هذه الدراسة.قام Galibourg et al24 بمقارنة MAE وRMSE بين طريقتين تقليديتين (طريقة Demirjian وطريقة Willems29) و10 نماذج DM في مجموعة سكانية فرنسية تتراوح أعمارهم بين 2 إلى 24 عامًا.وأفادوا أن جميع نماذج DM كانت أكثر دقة من الطرق التقليدية، مع اختلافات قدرها 0.20 و0.38 سنة في MAE و0.25 و0.47 سنة في RMSE مقارنة بطرق ويليمز وديميردجيان، على التوالي.يأخذ التناقض بين نموذج SD والطرق التقليدية الموضحة في دراسة هاليبورج في الاعتبار العديد من التقارير 30،31،32،33 التي تفيد بأن طريقة ديميردجيان لا تقدر بدقة عمر الأسنان لدى السكان غير الكنديين الفرنسيين الذين استندت إليهم الدراسة.في هذه الدراسة.استخدم تاي وآخرون 34 خوارزمية MLP للتنبؤ بعمر الأسنان من 1636 صورة فوتوغرافية صينية لتقويم الأسنان وقارنوا دقتها بنتائج طريقة دميرجيان وويلمز.وأفادوا أن MLP تتمتع بدقة أعلى من الطرق التقليدية.الفرق بين طريقة دميردجيان والطريقة التقليدية هو <0.32 سنة، وطريقة ويليمز 0.28 سنة، وهو ما يشبه نتائج الدراسة الحالية.تتوافق نتائج هذه الدراسات السابقة أيضًا مع نتائج الدراسة الحالية، كما أن دقة تقدير العمر لنموذج DM والطريقة التقليدية متشابهة.ومع ذلك، استناداً إلى النتائج المقدمة، لا يمكننا إلا أن نستنتج بحذر أن استخدام نماذج DM لتقدير العمر قد يحل محل الأساليب الحالية بسبب عدم وجود دراسات سابقة مقارنة ومرجعية.هناك حاجة لدراسات المتابعة باستخدام عينات أكبر لتأكيد النتائج التي تم الحصول عليها في هذه الدراسة.
من بين الدراسات التي اختبرت دقة SD في تقدير عمر الأسنان، أظهر بعضها دقة أعلى من دراستنا.قام ستيبانوفسكي وآخرون بتطبيق 22 نموذجًا من نماذج SD على الصور الشعاعية البانورامية لـ 976 من السكان التشيكيين الذين تتراوح أعمارهم بين 2.7 إلى 20.5 عامًا واختبروا دقة كل نموذج.وقاموا بتقييم نمو ما مجموعه 16 من الأسنان الدائمة العلوية والسفلية اليسرى باستخدام معايير التصنيف التي اقترحها موريس وآخرون 36 .يتراوح MAE من 0.64 إلى 0.94 سنة ويتراوح RMSE من 0.85 إلى 1.27 سنة، وهما أكثر دقة من نموذجي DM المستخدمين في هذه الدراسة.استخدم Shen et al23 طريقة Cameriere لتقدير عمر الأسنان لسبعة أسنان دائمة في الفك السفلي الأيسر لدى سكان شرق الصين الذين تتراوح أعمارهم بين 5 إلى 13 عامًا ومقارنتها بالأعمار المقدرة باستخدام الانحدار الخطي وSVM وRF.لقد أظهروا أن جميع نماذج DM الثلاثة تتمتع بدقة أعلى مقارنة بصيغة Cameriere التقليدية.كانت MAE وRMSE في دراسة Shen أقل من تلك الموجودة في نموذج DM في هذه الدراسة.زيادة دقة الدراسات التي أجراها ستيبانوفسكي وآخرون.35 وشين وآخرون.23 قد يكون بسبب إدراج مواضيع أصغر سنا في عينات دراستهم.نظرًا لأن تقديرات العمر للمشاركين ذوي الأسنان النامية تصبح أكثر دقة مع زيادة عدد الأسنان أثناء نمو الأسنان، فإن دقة طريقة تقدير العمر الناتجة قد تتعرض للخطر عندما يكون المشاركون في الدراسة أصغر سنًا.بالإضافة إلى ذلك، فإن خطأ MLP في تقدير العمر أصغر قليلاً من خطأ SLP، مما يعني أن خطأ MLP أكثر دقة من SLP.يعتبر MLP أفضل قليلاً لتقدير العمر، ربما بسبب الطبقات المخفية في MLP38.ومع ذلك، هناك استثناء للعينة الخارجية من النساء (SLP 1.45، MLP 1.49).يتطلب اكتشاف أن MLP أكثر دقة من SLP في تقييم العمر إجراء دراسات إضافية بأثر رجعي.
وتمت أيضًا مقارنة أداء التصنيف لنموذج DM والطريقة التقليدية عند عتبة 18 عامًا.أظهرت جميع نماذج SD التي تم اختبارها والطرق التقليدية في مجموعة الاختبار الداخلي مستويات تمييز مقبولة عمليًا للعينة البالغة من العمر 18 عامًا.كانت الحساسية للرجال والنساء أكبر من 87.7% و94.9% على التوالي، وكانت النوعية أكبر من 89.3% و84.7%.يتجاوز AUROC لجميع النماذج التي تم اختبارها أيضًا 0.925.على حد علمنا، لم تقم أي دراسة باختبار أداء نموذج DM لتصنيف 18 عامًا على أساس نضج الأسنان.يمكننا مقارنة نتائج هذه الدراسة بأداء تصنيف نماذج التعلم العميق على الصور الشعاعية البانورامية.قام Guo et al.15 بحساب أداء التصنيف لنموذج التعلم العميق القائم على CNN وطريقة يدوية تعتمد على طريقة Demirjian لعتبة عمرية معينة.وكانت حساسية ونوعية الطريقة اليدوية 87.7% و95.5% على التوالي، وتجاوزت حساسية ونوعية نموذج CNN 89.2% و86.6% على التوالي.وخلصوا إلى أن نماذج التعلم العميق يمكن أن تحل محل التقييم اليدوي أو تتفوق عليه في تصنيف الحدود العمرية.وأظهرت نتائج هذه الدراسة أداء تصنيف مماثل؛من المعتقد أن التصنيف باستخدام نماذج DM يمكن أن يحل محل الأساليب الإحصائية التقليدية لتقدير العمر.ومن بين النماذج، كان DM LR هو النموذج الأفضل من حيث الحساسية للعينة الذكورية والحساسية والنوعية للعينة الأنثوية.يحتل LR المرتبة الثانية من حيث الخصوصية بالنسبة للرجال.علاوة على ذلك، يعتبر LR أحد نماذج DM35 الأكثر سهولة في الاستخدام وأقل تعقيدًا وصعوبة في المعالجة.وبناءً على هذه النتائج، تم اعتبار LR أفضل نموذج تصنيف للقطع للأطفال بعمر 18 عامًا في السكان الكوريين.
بشكل عام، كانت دقة تقدير العمر أو أداء التصنيف على مجموعة الاختبارات الخارجية ضعيفة أو أقل مقارنة بالنتائج على مجموعة الاختبارات الداخلية.تشير بعض التقارير إلى أن دقة التصنيف أو كفاءته تنخفض عندما يتم تطبيق تقديرات العمر المستندة إلى السكان الكوريين على السكان اليابانيين، وقد تم العثور على نمط مماثل في هذه الدراسة.ولوحظ اتجاه التدهور هذا أيضًا في نموذج DM.ولذلك، لتقدير العمر بدقة، حتى عند استخدام DM في عملية التحليل، ينبغي تفضيل الأساليب المستمدة من بيانات السكان الأصليين، مثل الأساليب التقليدية.نظرًا لأنه من غير الواضح ما إذا كانت نماذج التعلم العميق يمكن أن تظهر اتجاهات مماثلة، فإن هناك حاجة إلى دراسات تقارن دقة التصنيف وكفاءته باستخدام الطرق التقليدية ونماذج DM ونماذج التعلم العميق على نفس العينات لتأكيد ما إذا كان الذكاء الاصطناعي يمكنه التغلب على هذه الفوارق العرقية في عمر محدود.التقييمات.
لقد أثبتنا أنه يمكن استبدال الأساليب التقليدية بتقدير العمر بناءً على نموذج DM في ممارسة تقدير عمر الطب الشرعي في كوريا.اكتشفنا أيضًا إمكانية تنفيذ التعلم الآلي لتقييم عمر الطب الشرعي.ومع ذلك، هناك قيود واضحة، مثل عدم كفاية عدد المشاركين في هذه الدراسة لتحديد النتائج بشكل نهائي، وعدم وجود دراسات سابقة لمقارنة نتائج هذه الدراسة وتأكيدها.في المستقبل، ينبغي إجراء دراسات DM بأعداد أكبر من العينات ومجموعات سكانية أكثر تنوعًا لتحسين قابليتها للتطبيق العملي مقارنة بالطرق التقليدية.للتحقق من جدوى استخدام الذكاء الاصطناعي لتقدير العمر في مجموعات سكانية متعددة، هناك حاجة إلى دراسات مستقبلية لمقارنة دقة التصنيف وكفاءة نماذج DM والتعلم العميق مع الطرق التقليدية في نفس العينات.
استخدمت الدراسة 2657 صورة إملائية تم جمعها من البالغين الكوريين واليابانيين الذين تتراوح أعمارهم بين 15 إلى 23 عامًا.تم تقسيم الصور الشعاعية الكورية إلى 900 مجموعة تدريب (19.42 ± 2.65 سنة) و 900 مجموعة اختبار داخلي (19.52 ± 2.59 سنة).تم جمع مجموعة التدريب في مؤسسة واحدة (مستشفى سيول سانت ماري)، وتم جمع مجموعة الاختبار الخاصة في مؤسستين (مستشفى طب الأسنان بجامعة سيول الوطنية ومستشفى طب الأسنان بجامعة يونسي).قمنا أيضًا بجمع 857 صورة شعاعية من بيانات سكانية أخرى (جامعة إيواتي الطبية، اليابان) لإجراء الاختبارات الخارجية.تم اختيار الصور الشعاعية للموضوعات اليابانية (19.31 ± 2.60 سنة) كمجموعة اختبار خارجية.تم جمع البيانات بأثر رجعي لتحليل مراحل نمو الأسنان على الصور الشعاعية البانورامية التي تم التقاطها أثناء علاج الأسنان.جميع البيانات التي تم جمعها كانت مجهولة المصدر باستثناء الجنس وتاريخ الميلاد وتاريخ التصوير الشعاعي.وكانت معايير الاشتمال والاستبعاد هي نفس الدراسات المنشورة سابقا 4، 5.تم حساب العمر الفعلي للعينة بطرح تاريخ الميلاد من تاريخ التقاط الصورة الشعاعية.تم تقسيم مجموعة العينة إلى تسع فئات عمرية.يتم عرض توزيعات العمر والجنس في الجدول 3. أجريت هذه الدراسة وفقًا لإعلان هلسنكي ووافق عليها مجلس المراجعة المؤسسية (IRB) بمستشفى سيول سانت ماري التابع للجامعة الكاثوليكية في كوريا (KC22WISI0328).بسبب التصميم بأثر رجعي لهذه الدراسة، لا يمكن الحصول على موافقة مستنيرة من جميع المرضى الذين يخضعون للفحص الشعاعي للأغراض العلاجية.تنازل مستشفى سانت ماري بجامعة سيول الكورية (IRB) عن شرط الموافقة المستنيرة.
تم تقييم المراحل التنموية للأضراس ثنائية الفكين الثانية والثالثة وفقًا لمعايير دميركان.يتم اختيار سن واحد فقط إذا تم العثور على نفس النوع من الأسنان على الجانبين الأيمن والأيسر من كل فك.إذا كانت الأسنان المتماثلة على كلا الجانبين في مراحل نمو مختلفة، فسيتم اختيار السن ذو مرحلة النمو الأقل لمراعاة عدم اليقين في العمر المقدر.تم تسجيل مائة صورة شعاعية تم اختيارها عشوائيًا من مجموعة التدريب بواسطة مراقبين ذوي خبرة لاختبار موثوقية المراقبين بعد المعايرة المسبقة لتحديد مرحلة نضج الأسنان.تم تقييم موثوقية Intraobserver مرتين على فترات لمدة ثلاثة أشهر من قبل المراقب الأساسي.
تم تقدير مرحلة الجنس والنمو للأضراس الثانية والثالثة لكل فك في مجموعة التدريب بواسطة مراقب أولي تم تدريبه باستخدام نماذج DM مختلفة، وتم تحديد العمر الفعلي كقيمة مستهدفة.تم اختبار نماذج SLP وMLP، المستخدمة على نطاق واسع في التعلم الآلي، مقابل خوارزميات الانحدار.يجمع نموذج DM بين الوظائف الخطية باستخدام مراحل نمو الأسنان الأربعة ويجمع هذه البيانات لتقدير العمر.SLP هي أبسط شبكة عصبية ولا تحتوي على طبقات مخفية.يعمل SLP على أساس انتقال العتبة بين العقد.نموذج SLP في الانحدار يشبه رياضيا الانحدار الخطي المتعدد.على عكس نموذج SLP، يحتوي نموذج MLP على طبقات مخفية متعددة مع وظائف التنشيط غير الخطية.استخدمت تجاربنا طبقة مخفية تحتوي على 20 عقدة مخفية فقط مع وظائف تنشيط غير خطية.استخدم النسب المتدرج كطريقة للتحسين وMAE وRMSE كوظيفة الخسارة لتدريب نموذج التعلم الآلي الخاص بنا.تم تطبيق أفضل نموذج انحدار تم الحصول عليه على مجموعات الاختبار الداخلية والخارجية وتم تقدير عمر الأسنان.
تم تطوير خوارزمية تصنيف تستخدم نضج أربعة أسنان في مجموعة التدريب للتنبؤ بما إذا كان عمر العينة 18 عامًا أم لا.لبناء النموذج، قمنا باستخلاص سبع خوارزميات للتعلم الآلي التمثيلي6،43: (1) LR، (2) KNN، (3) SVM، (4) DT، (5) RF، (6) XGBoost، و (7) MLP .LR هي واحدة من خوارزميات التصنيف الأكثر استخدامًا على نطاق واسع .هي خوارزمية تعلم خاضعة للإشراف تستخدم الانحدار للتنبؤ باحتمالية انتماء البيانات إلى فئة معينة من 0 إلى 1 وتصنيف البيانات على أنها تنتمي إلى فئة أكثر احتمالية بناءً على هذا الاحتمال؛تستخدم أساسا للتصنيف الثنائي.KNN هي واحدة من أبسط خوارزميات التعلم الآلي.عند إعطاء بيانات إدخال جديدة، فإنه يجد بيانات k قريبة من المجموعة الموجودة ثم يصنفها في الفئة ذات التردد الأعلى.قمنا بتعيين 3 لعدد الجيران الذين تم النظر فيهم (ك).SVM هي خوارزمية تعمل على زيادة المسافة بين فئتين باستخدام دالة kernel لتوسيع المساحة الخطية إلى مساحة غير خطية تسمى الحقول 46.في هذا النموذج، نستخدم التحيز = 1، والطاقة = 1، وغاما = 1 كمعلمات مفرطة للنواة متعددة الحدود.تم تطبيق DT في مجالات مختلفة كخوارزمية لتقسيم مجموعة البيانات بأكملها إلى عدة مجموعات فرعية من خلال تمثيل قواعد القرار في بنية شجرة .تم تكوين النموذج مع الحد الأدنى لعدد السجلات لكل عقدة وهو 2 ويستخدم مؤشر Gini كمقياس للجودة.RF عبارة عن طريقة مجمعة تجمع بين عدة DTs لتحسين الأداء باستخدام طريقة تجميع التمهيد التي تنشئ مصنفًا ضعيفًا لكل عينة عن طريق رسم عينات من نفس الحجم بشكل عشوائي عدة مرات من مجموعة البيانات الأصلية .استخدمنا 100 شجرة، و10 أعماق شجرة، والحد الأدنى لحجم عقدة واحدة، ومؤشر اختلاط جيني كمعايير لفصل العقد.ويتم تحديد تصنيف البيانات الجديدة بأغلبية الأصوات.XGBoost عبارة عن خوارزمية تجمع بين تقنيات التعزيز باستخدام طريقة تأخذ الخطأ بين القيم الفعلية والمتوقعة للنموذج السابق كبيانات تدريب وتزيد الخطأ باستخدام التدرجات.إنها خوارزمية مستخدمة على نطاق واسع نظرًا لأدائها الجيد وكفاءة استخدام الموارد، فضلاً عن الموثوقية العالية كوظيفة تصحيح التجهيز الزائد.النموذج مجهز بـ 400 عجلة دعم.MLP عبارة عن شبكة عصبية يشكل فيها واحد أو أكثر من الإدراك الحسي طبقات متعددة مع طبقة مخفية واحدة أو أكثر بين طبقات الإدخال والإخراج .باستخدام هذا، يمكنك إجراء تصنيف غير خطي حيث عند إضافة طبقة إدخال والحصول على قيمة نتيجة، تتم مقارنة قيمة النتيجة المتوقعة بقيمة النتيجة الفعلية ويتم نشر الخطأ مرة أخرى.لقد أنشأنا طبقة مخفية تحتوي على 20 خلية عصبية مخفية في كل طبقة.تم تطبيق كل نموذج قمنا بتطويره على مجموعات داخلية وخارجية لاختبار أداء التصنيف عن طريق حساب الحساسية والنوعية وPPV وNPV وAUROC.يتم تعريف الحساسية على أنها نسبة العينة المقدرة بعمر 18 عامًا أو أكثر إلى العينة المقدرة بعمر 18 عامًا أو أكثر.النوعية هي نسبة العينات التي تقل أعمارها عن 18 عامًا وتلك المقدرة بعمر أقل من 18 عامًا.
تم تحويل مراحل الأسنان التي تم تقييمها في مجموعة التدريب إلى مراحل رقمية للتحليل الإحصائي.تم إجراء الانحدار الخطي واللوجستي متعدد المتغيرات لتطوير نماذج تنبؤية لكل جنس واستخلاص صيغ الانحدار التي يمكن استخدامها لتقدير العمر.استخدمنا هذه الصيغ لتقدير عمر الأسنان لكل من مجموعات الاختبار الداخلية والخارجية.ويبين الجدول 4 نماذج الانحدار والتصنيف المستخدمة في هذه الدراسة.
تم حساب الموثوقية داخل وبين المراقبين باستخدام إحصائية كوهين كابا.لاختبار دقة نماذج DM ونماذج الانحدار التقليدية، قمنا بحساب MAE وRMSE باستخدام الأعمار المقدرة والفعلية لمجموعات الاختبار الداخلية والخارجية.تُستخدم هذه الأخطاء بشكل شائع لتقييم دقة تنبؤات النماذج.كلما كان الخطأ أصغر، كلما زادت دقة التنبؤ.قارن MAE وRMSE لمجموعات الاختبار الداخلية والخارجية المحسوبة باستخدام DM والانحدار التقليدي.تم تقييم أداء التصنيف للقطع لمدة 18 عامًا في الإحصائيات التقليدية باستخدام جدول الطوارئ 2 × 2.تمت مقارنة الحساسية المحسوبة والنوعية وPPV وNPV وAUROC لمجموعة الاختبار مع القيم المقاسة لنموذج تصنيف DM.يتم التعبير عن البيانات على أنها الانحراف المعياري المتوسط ​​أو الرقم (٪) اعتمادًا على خصائص البيانات.واعتبرت القيم P على الوجهين <0.05 ذات دلالة إحصائية.تم إجراء جميع التحليلات الإحصائية الروتينية باستخدام الإصدار 9.4 من SAS (SAS Institute، Cary، NC).تم تنفيذ نموذج انحدار DM في Python باستخدام Keras50 2.2.4 الخلفية و Tensorflow51 1.8.0 خصيصًا للعمليات الرياضية.تم تنفيذ نموذج تصنيف DM في بيئة تحليل المعرفة Waikato ومنصة التحليل Konstanz Information Miner (KNIME) 4.6.152.
يعترف المؤلفون بأن البيانات الداعمة لاستنتاجات الدراسة يمكن العثور عليها في المقالة والمواد التكميلية.مجموعات البيانات التي تم إنشاؤها و/أو تحليلها أثناء الدراسة متاحة من المؤلف المقابل بناءً على طلب معقول.
ريتز تيمي، S. وآخرون.تقييم العمر: أحدث ما توصلت إليه التكنولوجيا لتلبية المتطلبات المحددة لممارسة الطب الشرعي.الدولية.ي. الطب الشرعي.113، 129-136 (2000).
Schmeling، A.، Reisinger، W.، Geserik، G.، and Olze، A. الوضع الحالي لتقييم عمر الطب الشرعي للأشخاص الذين يعيشون لأغراض الملاحقة الجنائية.التحاليل الجنائية.الدواء.علم الأمراض.1، 239-246 (2005).
عموم، J. وآخرون.طريقة معدلة لتقييم عمر الأسنان للأطفال الذين تتراوح أعمارهم بين 5 إلى 16 سنة في شرق الصين.مرضي.المسح الشفهي.25، 3463–3474 (2021).
Lee، SS إلخ. التسلسل الزمني لتطور الأضراس الثانية والثالثة لدى الكوريين وتطبيقه لتقييم عمر الطب الشرعي.الدولية.ي. الطب الشرعي.124، 659-665 (2010).
Oh، S.، Kumagai، A.، Kim، SY and Lee، SS دقة تقدير العمر وتقدير عتبة 18 عامًا على أساس نضج الأضراس الثانية والثالثة في الكوريين واليابانيين.بلوس وان 17، e0271247 (2022).
كيم، جي واي، وآخرون.يمكن لتحليل البيانات المستندة إلى التعلم الآلي قبل الجراحة التنبؤ بنتائج علاج جراحة النوم لدى المرضى الذين يعانون من انقطاع النفس الانسدادي النومي (OSA).العلم.التقرير 11، 14911 (2021).
هان، M. وآخرون.تقدير دقيق للعمر من التعلم الآلي مع أو بدون تدخل بشري؟الدولية.ي. الطب الشرعي.136، 821–831 (2022).
خان، س. وشاهين، م. من التنقيب في البيانات إلى التنقيب في البيانات.معلومات.العلم.https://doi.org/10.1177/01655515211030872 (2021).
خان، س. وشاهين، م. ويس رول: الخوارزمية المعرفية الأولى للتعدين بقواعد الارتباط.معلومات.العلم.https://doi.org/10.1177/01655515221108695 (2022).
شاهين م. وعبد الله كرم: استخراج البيانات التقليدية على أساس قواعد الارتباط القائمة على السياق.احسب.غير لامع.يكمل.68، 3305–3322 (2021).
محمد م.، رحمن ز.، شاهين م.، خان م.، وحبيب م. اكتشاف التشابه الدلالي القائم على التعلم العميق باستخدام البيانات النصية.يخبر.التقنيات.يتحكم.https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish، M.، Tanoli، Z.، and Shahin، M. نظام للتعرف على النشاط في مقاطع الفيديو الرياضية.الوسائط المتعددة.تطبيقات الأدوات https://doi.org/10.1007/s11042-021-10519-6 (2021).
الحلبي، سس وآخرون.تحدي التعلم الآلي RSNA في عصر عظام الأطفال.الأشعة 290، 498-503 (2019).
لي، Y. وآخرون.تقدير عمر الطب الشرعي من الأشعة السينية للحوض باستخدام التعلم العميق.اليورو.إشعاع.29، 2322–2329 (2019).
قوه، YC، وآخرون.تصنيف عمري دقيق باستخدام الطرق اليدوية والشبكات العصبية التلافيفية العميقة من صور الإسقاط الإملائي.الدولية.ي. الطب الشرعي.135، 1589–1597 (2021).
ألاباما دالورا وآخرون.تقدير عمر العظام باستخدام طرق مختلفة للتعلم الآلي: مراجعة منهجية للأدبيات والتحليل التلوي.بلوس وان 14، e0220242 (2019).
Du، H.، Li، G.، Cheng، K.، and Yang، J. تقدير العمر الخاص بالسكان للأمريكيين الأفارقة والصينيين بناءً على أحجام حجرة اللب للأضراس الأولى باستخدام التصوير المقطعي المحوسب ذو الشعاع المخروطي.الدولية.ي. الطب الشرعي.136، 811–819 (2022).
Kim S.، Lee YH، Noh YK، Park FK، Oh KS تحديد الفئات العمرية للأشخاص الأحياء باستخدام الصور المبنية على الذكاء الاصطناعي للأضراس الأولى.العلم.التقرير 11، 1073 (2021).
Stern، D.، Payer، C.، Giuliani، N.، and Urschler، M. تقدير العمر التلقائي وتصنيف سن الأغلبية من بيانات التصوير بالرنين المغناطيسي متعددة المتغيرات.IEEE J. بيوميد.التنبيهات الصحية.23، 1392–1403 (2019).
Cheng، Q.، Ge، Z.، Du، H. and Li، G. تقدير العمر بناءً على تجزئة حجرة اللب ثلاثية الأبعاد للأضراس الأولى من التصوير المقطعي المحوسب بالشعاع المخروطي من خلال دمج التعلم العميق ومجموعات المستوى.الدولية.ي. الطب الشرعي.135، 365–373 (2021).
وو، وت، وآخرون.استخراج البيانات في البيانات الكبيرة السريرية: قواعد البيانات والخطوات ونماذج الأساليب المشتركةعالم.الدواء.الموارد.8، 44 (2021).
يانغ، J. وآخرون.مقدمة لقواعد البيانات الطبية وتقنيات استخراج البيانات في عصر البيانات الضخمة.جي AVID.الطب الأساسي.13، 57-69 (2020).
شين، S. وآخرون.طريقة كاميرر لتقدير عمر الأسنان باستخدام التعلم الآلي.بي إم سي لصحة الفم 21, 641 (2021).
جاليبورج أ وآخرون.مقارنة طرق التعلم الآلي المختلفة للتنبؤ بعمر الأسنان باستخدام طريقة Demirdjian التدريج.الدولية.ي. الطب الشرعي.135، 665–675 (2021).
Demirdjian، A.، Goldstein، H. and Tanner، JM نظام جديد لتقييم عمر الأسنان.شخير.مادة الاحياء.45، 211-227 (1973).
Landis، JR، and Koch، GG تدابير اتفاق المراقب على البيانات الفئوية.القياسات الحيوية 33، 159-174 (1977).
بهاتاشارجي إس، براكاش دي، كيم سي، كيم هونج كونج، وتشوي هونج كونج.التحليل التركيبي والمورفولوجي والإحصائي للتصوير بالرنين المغناطيسي ثنائي الأبعاد باستخدام تقنيات الذكاء الاصطناعي للتفريق بين أورام المخ الأولية.معلومات صحية.الموارد.https://doi.org/10.4258/hir.2022.28.1.46 (2022).


وقت النشر: 04 يناير 2024