به عنوان انسان، هر یک تریلیون ها سلول داریم. و هر سلول دارای یک هسته با اطلاعات ژنتیکی فردی – DNA – است که می تواند برای ایجاد یک ناهنجاری جهش پیدا کند. اگر انسان با انبوهی از ناهنجاریها در سلولها متولد شود یا جهشها در طول زمان ایجاد شوند، بیماری ایجاد میشود. برای پیچیدهتر کردن این موضوع، سلولها اغلب مخلوطی از DNA غیرطبیعی و طبیعی هستند – به اصطلاح یک موزاییک، و مانند شکل هنری، درک این مونتاژ پیچیده دشوار است. با این حال، یک تیم تحقیقاتی به سرپرستی جوزف گلیسون، MD، استاد علوم اعصاب رادی در دانشکده پزشکی کالیفرنیا سن دیگو و مدیر تحقیقات علوم اعصاب در موسسه کودکان رادی برای پزشکی ژنومیک، از خوشه محاسبات مشترک تریتون (TSCC) در سان استفاده کرده است. مرکز ابررایانه دیگو (SDSC) در UC San Diego برای پردازش داده ها و آموزش مدل به منظور رونمایی از روش های جدید برای تشخیص موزاییک DNA.
گلیسون و تیمش اخیراً ژنها و مسیرهای جدیدی را در ناهنجاری رشد قشر مغز، طیفی از اختلالات که تا 40 درصد از صرع کانونی مقاوم به دارو را ایجاد میکنند، کشف کردهاند. تحقیقات آنها نشان میدهد که چگونه مدلهای تولید شده توسط کامپیوتر میتوانند کار تشخیص انسان را به شیوهای بسیار کارآمدتر تقلید کنند و این هفته در Nature Genetics منتشر شد. یک مطالعه مرتبط در اوایل این ماه در Nature Biotechnology منتشر شد.
ما سال ها پیش با تخصیص آزمایشی روی ابررایانه Comet SDSC شروع کردیم و تقریباً یک دهه است که بخشی از جامعه TSCC بوده ایم. TSCC به ما اجازه میدهد مدلهای تولید شده توسط یک برنامه تشخیص کامپیوتری به نام DeepMosaic را ترسیم کنیم و این شبیهسازیها به ما این امکان را میدهد تا متوجه شویم زمانی که برنامه ابررایانهای را برای شناسایی مناطق غیرعادی سلولها آموزش دادیم، توانستیم به سرعت هزاران گونه موزاییکی را از هر ژنوم انسانی بررسی کنیم. اگر این کار با چشم انسان انجام شود امکان پذیر نخواهد بود.”
Xiaoxu Yang، محقق فوق دکتری در آزمایشگاه بیماری مغز کودکان دکتر گلیسون
این نوع دانش تولید شده توسط کامپیوتر به عنوان یادگیری عمیق مبتنی بر شبکه عصبی کانولوشن شناخته می شود و از دهه 1970 وجود داشته است. در آن زمان، شبکههای عصبی برای تقلید از پردازش بصری انسان ساخته میشدند. تنها چند دهه طول کشیده است تا محققان سیستم های دقیق و کارآمدی را برای این نوع مدل سازی توسعه دهند.
“هدف یادگیری ماشینی و یادگیری عمیق اغلب آموزش رایانهها برای انجام وظایف پیشبینی یا طبقهبندی بر روی دادههای برچسبگذاری شده است. زمانی که مدلهای آموزشدیده دقیق و کارآمد ثابت شوند، محققان از اطلاعات آموختهشده استفاده میکنند – به جای حاشیهنویسی دستی برای پردازش بزرگ. شین ژو، دستیار تحقیقاتی سابق در آزمایشگاه گلیسون و اکنون دانشمند داده در Novartis توضیح داد. ما در طول 40 سال گذشته راه درازی را در توسعه الگوریتمهای یادگیری ماشینی و یادگیری عمیق پیمودهایم، اما همچنان از همان مفهومی استفاده میکنیم که توانایی انسان برای پردازش دادهها را تکرار میکند.»
Xu به دانش مورد نیاز برای درک بهتر بیماری های ناشی از غلبه موزاییک های غیرعادی به سلول های طبیعی اشاره دارد. یانگ و زو در آزمایشگاهی کار میکنند که هدف آن انجام این کار است – درک بهتر این موزاییکهایی که منجر به بیماریهایی مانند صرع، اختلالات مغزی مادرزادی و غیره میشوند.
Xu گفت: “رویکردهای یادگیری عمیق بسیار کارآمدتر هستند و توانایی آنها در تشخیص ساختارها و ارتباطات پنهان در داده ها گاهی حتی از توانایی انسان نیز فراتر می رود.” ما میتوانیم دادهها را بسیار سریعتر از این طریق پردازش کنیم، که ما را سریعتر به دانش مورد نیاز میرساند.»