Alphagenome من Google Deepmind ، الذي تم الإعلان عنه اليوم ، ليس مجرد إدخال آخر في سباق AI-For-Science Arms. مع وصول API المتاح للبحث غير التجاري-والتوثيق الشامل والدعم المجتمعي المستضاف على Github-يشير إلى أن الجينوم ، بمجرد أن تقتصر على المختبرات المتخصصة ومجموعات البيانات المقيدة ، يتحرك بسرعة نحو العلوم المفتوحة.

هذه صفقة كبيرة جدا.

تخيل أن الحمض النووي الخاص بك يشبه دليل التعليمات العملاقة لكيفية عمل جسمك. لفترة طويلة ، لم يتمكن العلماء من فهم الأجزاء التي أخبرت جسمك بشكل مباشر عن كيفية بناء الأشياء ، مثل البروتينات. لكن معظم الحمض النووي الخاص بك – أكثر من 90 ٪ منه – ليس هكذا. لا يبني أي شيء مباشرة. اعتاد الناس على تسميته “الحمض النووي غير المرغوب فيه”.

الآن نعلم أن “Junk” يقوم بالفعل بشيء مهم: فهو يساعد على التحكم في متى وأين يتم استخدام التعليمات الحقيقية – مثل لوحة التحكم المليئة بالمفاتيح والأوجه. المشكلة؟ من الصعب حقًا القراءة والفهم.

هذا هو المكان الذي يأتي فيه Alphagenome.

Alphagenome هو نموذج قوي لمنظمة العفو الدولية التي صممها Google DeepMind يمكنها قراءة هذه الأجزاء المربكة من الحمض النووي أفضل من أي شيء آخر قبل ذلك. يستخدم التعلم الآلي المتقدم (مثل النوع وراء مولدات الصور أو الدردشة) للنظر في أقسام ضخمة من الحمض النووي – إلى ما مدى مليون حرف – ومعرفة الأجزاء المهمة ، وكيف تؤثر على جيناتك ، وحتى كيف يمكن أن تؤدي الطفرات إلى المرض.

إنه نوع من مثل وجود مجهر من الذكاء الاصطناعي الفائق الذي لا يقرأ الدليل فحسب ، بل يكتشف كيف يتم تشغيل النظام بأكمله وإيقافه-وما يحدث عندما تسوء الأمور.

الأمر الرائع هو أن DeepMind يشارك هذه الأداة من خلال واجهة برمجة التطبيقات (وسيلة لأجهزة الكمبيوتر للتحدث إليها) ، حتى يتمكن العلماء والباحثون الطبيون في جميع أنحاء العالم من استخدامها مجانًا في أبحاثهم. هذا يعني أنه يمكن أن يساعد في تسريع الاكتشافات في أشياء مثل الأمراض الوراثية والطب الشخصي وحتى العلاجات المضادة للشيخوخة.

باختصار: يساعد Alphagenome العلماء على قراءة أجزاء من الحمض النووي الذي لم نفهمه من قبل – وهذا يمكن أن يغير كل شيء عن كيفية علاج المرض.

Alphagenome هو نموذج تعليمي عميق مصمم لتحليل كيفية تنظيم تسلسل الحمض النووي التعبير الجيني وغيرها من الوظائف الحرجة. على عكس النماذج الأقدم التي تمكنت من تحليل شظايا الحمض النووي القصيرة ، يمكن للألفاجينوم معالجة تسلسل ما يصل إلى مليون زوج من القاعدة – وهو مقياس غير مسبوق يسمح لها بتقاط التفاعلات التنظيمية البعيدة التي تفتقدها الطرق السابقة.

قوة Alphagenome الأساسية هي محرك التنبؤ متعدد الوسائط. على عكس النماذج السابقة التي يمكن أن تتنبأ بنوع واحد من النشاط الجيني ، يخرج هذا النموذج تنبؤات عالية الدقة للتعبير الجيني (RNA-SEQ ، قفص) ، أحداث الربط ، حالات الكروماتين (بما في ذلك حساسية DNase وتعديلات هيستون) ، وخرائط التلامس الكروماتين ثلاثية الأبعاد.

هذا يجعلها مفيدة ليس فقط لتحديد الجينات التي يتم تشغيلها أو إيقافها في الخلية ، ولكن لفهم الرقص المعقد لطي الجينوم ، والتحرير ، وإمكانية الوصول.

البنية ملحوظة ، لكنها لا تزال مألوفة جدًا إذا كنت تستخدم الانتشار المستقر أو LLM العادي مفتوح المصدر محليًا: يستخدم Alphagenome شبكة عصبية مستوحاة من الشبكة U ، مع حوالي 450 مليون معلمة قابلة للدرار.

نعم ، هذا منخفض جدًا إذا كنت تتطابق مع نماذج اللغة الضعيفة والأصغر التي تعمل مع مليارات من المعلمات. ومع ذلك ، بالنظر إلى أن الحمض النووي يتعامل فقط مع 4 قواعد واثنين فقط من الأزواج – من الناحية العملية ، فإن الجينوم البشري بأكمله ليس سوى مزيج من 3 مليارات أزواج من الحروف في و CG – إنه نموذج محدد للغاية ، مصمم للقيام بشيء واحد بشكل جيد للغاية.

يحتوي النموذج على تشفير تسلسل يتراجع عن الأسماء من الدقة ذات القاعدة الفردية إلى تمثيلات خشن ، ثم تقوم طرازات نموذج المحولات بعبارة طويلة المدى قبل إعادة بناء وحدة فك الترميز إلى مستوى القاعدة الواحدة. وهذا يتيح التنبؤات في قرارات مختلفة ، مما يسمح بكل من التحليلات التنظيمية ذات الحبيبات الدقيقة والعرض.

اعتمد تدريب النموذج على مجموعة واسعة من مجموعات البيانات المتاحة للجمهور ، بما في ذلك Encode و GTEX و 4D Nucleome و Fantom5 – التي تمثل جماعياً الآلاف من الملامح التجريبية عبر أنواع الخلايا البشرية والماوس.

وكانت هذه العملية أيضًا سريعة جدًا: باستخدام TPUs المخصصة من Google ، أكمل DeepMind عملية ما قبل التدريب والتقطير في أربع ساعات فقط ، وذلك باستخدام نصف الميزانية الحسابية التي يتطلبها سلفها ، Enformer.

تفوقت Alphagenome على النماذج الحديثة في 22 من بين 24 اختبارًا للتنبؤ بالتسلسل و 24 من أصل 26 تنبؤًا للتأثير المتغير ، وهو عملية مسح نظيفة نادرة في المعايير التي تكون فيها التحسينات الإضافية هي القاعدة. إنها تعمل بشكل جيد ، في الواقع ، بحيث يمكنها مقارنة الحمض النووي المتحور وغير المقلوب ، مما يتنبأ بتأثير المتغيرات الوراثية في ثوانٍ – وهي أداة حاسمة لأصل أصول الباحثين.

هذا مهم ، لأن الجينوم غير المشفر يحتوي على العديد من المفاتيح التنظيمية التي تتحكم في وظيفة الخلايا وخطر المرض. تكشف نماذج مثل Alphagenome عن مقدار البيولوجيا البشرية التي يحكمها هذه المناطق المعتمة سابقًا.

من الصعب تجاهل تأثير الذكاء الاصطناعي على علم الأحياء اليوم. Take Ankh ، وهو نموذج لغة البروتين التي طورتها فرق من جامعة ميونيخ التقنية ، وجامعة كولومبيا ، وبروتنيا بدء التشغيل. يعالج Ankh تسلسل البروتين مثل اللغة ، وتوليد بروتينات جديدة ويتنبأ بسلوكها – وهو يشبه كيفية ترجمة Alphagenome “قواعد” تنظيمية من الحمض النووي.

تقنية أخرى مجاورة ، Genslms في Nvidia ، توضح قدرة الذكاء الاصطناعى على التنبؤ بالطفرات الفيروسية والمتغيرات الوراثية العنقودية للبحوث الودية. وفي الوقت نفسه ، يبرز استخدام الذكاء الاصطناعي لتعزيز التقدم في التدخلات المضادة للشيخوخة الكيميائية والقائمة على الجينات تقاطع علم الجينوم والتعلم الآلي والطب.

واحدة من أهم مساهمات Alphagenome هي إمكانية الوصول إليها. بدلاً من تقييد التطبيقات التجارية ، يتوفر النموذج عبر واجهة برمجة تطبيقات عامة للبحث غير التجاري.

على الرغم من أنها ليست مفتوحة بالكامل بعد – مما يعني أنه لا يمكن للباحثين تنزيله أو تشغيله أو تعديله محليًا – تتيح واجهة برمجة التطبيقات والموارد المصاحبة للعلماء في جميع أنحاء العالم توليد تنبؤات ، وتكييف التحليلات لمختلف الأنواع أو أنواع الخلايا ، وتوفير ملاحظات لتشكيل الإصدارات المستقبلية. أشار DeepMind إلى خطط لإصدار أوسع مفتوح المصدر أسفل الخط.

يمكن أن تتفتح قدرة Alphagenome على تحليل المتغيرات غير المشفرة-المنطقة التي يتم فيها العثور على معظم الطفرات المرتبطة بالأمراض-فهمًا جديدًا للاضطرابات الوراثية والأمراض النادرة. يدعم تسجيل البديل عالي السرعة أيضًا الطب الشخصي ، حيث تم تصميم العلاجات مع ملف تعريف الحمض النووي الفريد للفرد.

في الوقت الحالي ، يكون الجينوم غير المشفر أقل من صندوق أسود ، ويتم تعيين دور الذكاء الاصطناعي في الجينوم فقط للتوسع. قد لا يكون Alphagenome هو النموذج لنقلنا إلى “عالم جديد شجاع” لهكسلي ، لكنه علامة واضحة على المكان الذي تتجه إليه الأمور: المزيد من البيانات ، والتنبؤات الأفضل ، وفهم أعمق لكيفية عمل الحياة.

شاركها.