لغات البرمجة

صيغة ملف SAM: نظرة عامة

تعد صيغة ملف SAM (Sequence Alignment Map) شكلاً نصياً مستخدماً على نطاق واسع لتخزين تسلسلات الحمض النووي المُوازاة بتسلسل مرجعي. تم تطوير هذه الصيغة من قبل Heng Li و Bob Handsaker وآخرين، وقد أصبحت رائجة جداً في تخزين البيانات الخاصة بتسلسلات النيكليوتيدات التي تم إنتاجها بواسطة تقنيات التسلسل من الجيل التالي.

صيغة SAM تدعم القراءات القصيرة والطويلة التي تصل إلى 128 ميغا قاعدة زوجية، والتي يتم إنتاجها بواسطة منصات تسلسل مختلفة، وتُستخدم لحمل البيانات المُوازاة داخل أدوات تحليل الجينوم (GATK) وعبر معهد برود للأبحاث، ومعهد ويلكوم سانجر، وفي مشروع الجينوم البشري 1000. تستخدم صيغة SAM لموازاة تسلسلات النيكليوتيدات (مثل قراءات التسلسل) مع سلسلة مرجعية. وقد تحتوي الصيغة على جودة النداءات القاعدية والموازاة وبيانات أخرى.

بالإضافة إلى ذلك، تُستخدم صيغة SAM في عمليات التحليل الجينومي والتلاعب بالبيانات الجينومية، مما يُظهر أهمية هذا الشكل النصي في مجال البيولوجيا الحاسوبية والبيولوجيا الجزيئية.

للمزيد من المعلومات، يمكنك زيارة صفحة ويكيبيديا لصيغة SAM عبر هذا الرابط: صيغة SAM على ويكيبيديا