Machine learning ถอดรหัสจีโนมนับล้านตัวอย่างปลดล็อกแนวทางรักษามะเร็ง

จิกิตสา วิทยา

แมชชีนเลิร์นนิง (ML) หรือ "การเรียนรู้ของเครื่อง" เป็นส่วนหนึ่งของปัญญาประดิษฐ์ (Artificial intelligence) ซึ่งอัลกอริธึมแมชชีนเลิร์นนิงสร้างแบบจำลองตามข้อมูลตัวอย่าง เรียกว่า "ข้อมูลการฝึกอบรม" เพื่อทำการคาดคะเนหรือตัดสินใจโดยไม่ได้ตั้งโปรแกรมไว้อย่างชัดเจน โดยคอมพิวเตอร์จะเรียนรู้จากข้อมูลที่ให้ไว้เพื่อทำงานบางอย่าง สำหรับงานง่าย ๆ ที่กำหนดให้กับคอมพิวเตอร์ ซึ่งมันมีส่วนช่วยทุ่นแรงมนุษย์เป็นอย่างมาก โดยที่มนุษย์ไม่ต้องมาเสียเวลากำหนดอัลกอริธึมด้วยตัวเอง (1)

แมชชีนเลิร์นนิง สามารถเข้าไปช่วยงานได้ในหลากหลายสาขา แม้แต่ในงานด้านการแพทย์ และมันกำลังก้าวหน้าอย่างรวดเร็วในสาขานี้ ตัวอย่างเช่น ในปี 2012 Vinod Khosla ผู้ร่วมก่อตั้ง Sun Microsystems คาดการณ์ว่า 80% ของตำแหน่งงานของแพทย์จะหายไปในสองทศวรรษข้างหน้าจากซอฟต์แวร์วินิจฉัยทางการแพทย์สำหรับการเรียนรู้ด้วยเครื่องอัตโนมัติ (2) ในปี 2020 มีการใช้เทคโนโลยีแมชชีนเลิร์นนิงเพื่อช่วยในการวินิจฉัยและช่วยเหลือนักวิจัยในการพัฒนาวิธีรักษา COVID-19 (3)

ล่าสุด บทความใหม่จากมหาวิทยาลัยเฮลซิงกิ ซึ่งตีพิมพ์ในวันที่ 6 กันยายน 2022 Nature Communications ได้แนะนำวิธีการวิเคราะห์ข้อมูลจีโนมอย่างแม่นยำในการตรวจชิ้นเนื้อมะเร็ง เครื่องมือนี้ใช้วิธีการเรียนรู้ของแมชชีนเลิร์นนิง เพื่อแก้ไขดีเอ็นเอที่เสียหายและเปิดเผยกระบวนการกลายพันธุ์ที่แท้จริงในตัวอย่างเนื้องอก ซึ่งช่วยปลดล็อกแนวทางในการรักษามะเร็งและการผลิตยารักษาที่มีคุณค่ามหาศาลในตัวอย่างมะเร็งที่เก็บถาวรหลายล้านตัวอย่าง (4)

การวินิจฉัยตามระดับโมเลกุลช่วยจับคู่ผู้ป่วยที่การรักษามะเร็งที่เหมาะสม นักวิจัยให้ความสนใจเป็นพิเศษในการทำโปรไฟล์ดีเอ็นเอในตัวอย่างมะเร็งทางคลินิก Qingli Guo จากมหาวิทยาลัยเฮลซิงกิ ผู้นำการเขียนวิจัยชิ้นนี้กล่าวว่า แหล่งข้อมูลด้านมะเร็งที่ประเมินค่าไม่ได้นี้ไม่ได้ถูกใช้สำหรับการวินิจฉัยระดับโมเลกุลในปัจจุบันเนื่องจากคุณภาพของดีเอ็นเอไม่ดี นอกจากนี้ การแช่ฟอร์มาลินเพื่อเก็บรักษาตัวอย่าง ยังทำให้เกิดความเสียหายอย่างรุนแรงต่อดีเอ็นเอซึ่งเป็นความท้าทายที่หลีกเลี่ยงไม่ได้ในการวิเคราะห์จีโนมมะเร็งในเนื้อเยื่อที่เก็บรักษาไว้

การวิเคราะห์กระบวนการกลายพันธุ์ในจีโนมมะเร็งสามารถช่วยตรวจหามะเร็งในระยะเริ่มแรก วินิจฉัยมะเร็งได้อย่างแม่นยำ และเปิดเผยสาเหตุที่มะเร็งบางชนิดดื้อต่อการรักษา วิธีการใหม่นี้สามารถเร่งการพัฒนาการใช้งานทางคลินิกได้อย่างมาก ซึ่งอาจส่งผลกระทบโดยตรงต่อการดูแลผู้ป่วยมะเร็งในอนาคต

ที่น่าสนใจก็คือ วิธีการใหม่สามารถคาดการณ์การพัฒนากระบวนการมะเร็งได้มากกว่า 90% เลยทีเดียว

Qingli Guo ทำงานร่วมกันอย่างใกล้ชิดกับนักวิทยาศาสตร์จากสถาบันวิจัยโรคมะเร็ง (ICR) ลอนดอน และมหาวิทยาลัยควีนแมรีแห่งลอนดอน พัฒนาวิธีการเรียนรู้ด้วยเครื่อง/แมชชีนเลิร์นนิง ที่เรียกว่า FFPEsig เพื่อศึกษาว่าฟอร์มาลินทำให้เกิดกลายพันธุ์ดีเอ็นเออย่างไร

ผลลัพธ์แสดงให้เห็นว่าโดยปกติแล้ว เกือบครึ่งหนึ่งของกระบวนการตรวจมะเร็งจะพลาดไปโดยไม่มีการแก้ไขปัจจัยที่เข้ามารบกวนตัวอย่าง อย่างไรก็ตาม เมื่อใช้ FFPEsig มากกว่า 90% คาดการณ์ได้อย่างแม่นยำ

มะเร็งค่อยๆ พัฒนาขึ้น การทำโปรไฟล์กระบวนการกลายพันธุ์ในตัวอย่างตามแนวนอน (Longitudinal data คือ การติดตามตัวอย่างเดียวกันในเวลาต่างๆ กัน) สามารถช่วยในการระบุตัวทำนายข้อมูลทางคลินิกและวินิจฉัยโรคในแต่ละระยะของเนื้องอก

"การค้นพบของเราช่วยให้สามารถระบุลักษณะเฉพาะของอัตลักษณ์จำเพาะ (signatures) ที่เกี่ยวข้องทางคลินิกจากการตรวจชิ้นเนื้อเนื้องอกที่เก็บรักษาไว้ที่อุณหภูมิห้องมานานหลายทศวรรษ ด้วยความเข้าใจอย่างลึกซึ้งว่าฟอร์มาลินส่งผลต่อจีโนมของมะเร็งอย่างไร การศึกษาของเราจึงเปิดโอกาสอันยิ่งใหญ่ในการเปลี่ยนรูปแบบการทดสอบการตรวจหาอัตลักษณ์จำเพาะ (signatures) ที่พัฒนาขึ้นโดยใช้ตัวอย่างที่เก็บถาวรขนาดใหญ่ที่คุ้มค่า" Qingli Guo กล่าว (4)

นี่เป็นหนึ่งในความก้าวหน้าใหม่ในการใช้แมชชีนเลิร์นนิงเพื่อรักษามะเร็ง ที่ผ่านมามีความคืบหน้าในการใช้แมชชีนเลิร์นนิงเพื่อการนี้มาโดยตลอด เช่น เมื่อเร็วๆ นี้ มีการประกาศแนวทางการเรียนรู้เชิงลึกแบบใหม่ที่พัฒนาขึ้นโดยนักวิจัยจากสถาบัน Koch Institute for Integrative Cancer Research ที่ MIT และโรงพยาบาล Massachusetts General Hospital (MGH) ที่อาจช่วยจำแนกมะเร็งที่ไม่ทราบสาเหตุหลักได้โดยการดูโปรแกรมการแสดงออกของยีนที่เกี่ยวข้องกับการพัฒนาและการสร้างความแตกต่างของเซลล์ในระยะแรก (5)

ทั้งนี้ เซลล์มะเร็งมีลักษณะและพฤติกรรมค่อนข้างแตกต่างจากเซลล์ปกติ ส่วนหนึ่งเป็นเพราะการเปลี่ยนแปลงอย่างมากในการแสดงออกของยีน แต่เพราะความก้าวหน้าในการทำโปรไฟล์เซลล์เดียวและความพยายามในการจัดทำรายการรูปแบบการแสดงออกของเซลล์ที่แตกต่างกันในการทำแผนที่ของเซลล์ ทำให้มีข้อมูลมากมายที่บ่งชี้ว่ามะเร็งชนิดต่างๆ เกิดขึ้นได้อย่างไร นี่คือการใช้ดาต้าให้เป็นประโยชน์ต่อชีวิตมนุษย์อย่างยิ่ง

อย่างไรก็ตาม ความท้าทายในการใช้ดาต้าและแมชชีนเลิร์นนิงช่วยจับทางมะเร็งก็คือ หากแบบจำลองซับซ้อนเกินไปและแสดงถึงลักษณะเฉพาะของการแสดงออกของยีนมะเร็งมากเกินไป แบบจำลองอาจดูเหมือนเรียนรู้ข้อมูลการฝึกอบรมได้อย่างสมบูรณ์ แต่จะสะดุดเมื่อพบข้อมูลใหม่ แต่ถ้าลดความซับซ้อนของแบบจำลองโดยการลดจำนวนคุณลักษณะ แบบจำลองอาจพลาดข้อมูลประเภทต่าง ๆ ที่จะนำไปสู่การจำแนกประเภทมะเร็งได้อย่างแม่นยำ

แมชชีนเลิร์นนิงยังไม่สมบูรณ์แบบ แต่มันพร้อมที่จะพัฒนาให้สมบูรณ์แบบได้ในอนาคต อย่างน้อย การใช้อัลกอริธึมของมันได้ช่วยลดภาระหนักหน่วงจากการวินิจฉัยโดยอาศัยแรงมนุษย์ไปได้มากแล้ว

อย่างกรณีของทีมวิจัยที่ Koch Institute ได้สร้างสมดุลให้เกิดขึ้นกับแมชชีนเลิร์นนิงในการวิเคราะห์ตัวอย่างมะเร็งแบบต่างๆ โดยนักวิจัยได้เปรียบเทียบแผนที่ของเซลล์ขนาดใหญ่ 2 อัน โดยระบุความสัมพันธ์ระหว่างเนื้องอกและเซลล์ของตัวอ่อน ได้แก่ Cancer Genome Atlas (TCGA) ซึ่งมีข้อมูลการแสดงออกของยีนสำหรับเนื้องอก 33 ชนิด และ Mouse Organogenesis Cell Atlas (MOCA) ซึ่งกำหนดเส้นทาง 56 แบบแยกจากกัน เซลล์ตัวอ่อนในขณะที่พวกมันพัฒนาและแยกความแตกต่าง

แผนที่ผลลัพธ์ของความสัมพันธ์ระหว่างรูปแบบการแสดงออกของยีนพัฒนาการในเนื้องอกและเซลล์ตัวอ่อนถูกแปลงเป็นรูปแบบการเรียนรู้ด้วยแมชชีนเลิร์นนิง นักวิจัยได้แยกการแสดงออกของยีนของตัวอย่างเนื้องอกจาก TCGA ออกเป็นส่วนประกอบแต่ละส่วน ซึ่งสอดคล้องกับจุดเฉพาะของเวลาในวิถีการพัฒนา และกำหนดค่าทางคณิตศาสตร์ให้แต่ละองค์ประกอบเหล่านี้ จากนั้นนักวิจัยได้สร้างแบบจำลองการเรียนรู้ด้วยเครื่องที่เรียกว่า Developmental Multilayer Perceptron (D-MLP) ซึ่งจะจัทางส่วนประกอบในการพัฒนาของเนื้องอก และคาดการณ์ที่มาของมัน

หลังการฝึกฝนแมชชีนเลิร์นนิงระบบนี้แล้ว D-MLP ถูกนำไปใช้กับตัวอย่างใหม่ 52 ตัวอย่างของมะเร็งที่วินิจฉัยได้ยากโดยเฉพาะอย่างยิ่งของมะเร็งปฐมภูมิที่ไม่รู้จักกัยซึ่งไม่สามารถวินิจฉัยได้โดยใช้เครื่องมือที่มีอยู่ กรณีเหล่านี้แสดงถึงความท้าทายที่สุดที่พบในโรงพยาบาล MGH ในช่วงระยะเวลาสี่ 4 เริ่มต้นในปี 2017 แบบจำลองนี้จำแนกเนื้องอกออกเป็นสี่ประเภทและให้ผลการคาดการณ์และข้อมูลอื่น ๆ ที่สามารถชี้นำการวินิจฉัยและการรักษาผู้ป่วยเหล่านี้

อ้างอิง

1. Ethem Alpaydin (2020). Introduction to Machine Learning (Fourth ed.). MIT. pp. xix, 1–3, 13–18. ISBN 978-0262043793.

2. Vinod Khosla (January 10, 2012). "Do We Need Doctors or Algorithms?". Tech Crunch.

3. Vaishya, Raju; Javaid, Mohd; Khan, Ibrahim Haleem; Haleem, Abid (July 1, 2020). "Artificial Intelligence (AI) applications for COVID-19 pandemic". Diabetes & Metabolic Syndrome: Clinical Research & Reviews. 14 (4): 337–339. doi:10.1016/j.dsx.2020.04.012. PMC 7195043. PMID 32305024.

4. "Researchers use machine learning to unlock the genomic code in clinical cancer samples". (6-SEP-2022). UNIVERSITY OF HELSINKI.

5. Bendta Schroeder. (September 1, 2022). "Using machine learning to identify undiagnosable cancers". MIT NEWS.

ภาพ National Cancer Institute,

เฮลธ์เทค

409 views

Machine learning ถอดรหัสจีโนมนับล้านตัวอย่างปลดล็อกแนวทางรักษามะเร็ง

เรื่องที่เกี่ยวข้อง

อัพเดทล่าสุด

สธ.เตือน ดื่มเหล้า-สูบบุหรี่ เพิ่มความเสี่ยง มะเร็งศีรษะและคอ

สมศักดิ์ ชงแผนเพิ่ม ‘หมอ-พยาบาล’ ให้ครม.พิจารณา 30 ก.ค. พร้อมหนุนสมุนไพร ยาไทย ลดนำเข้า

สปสช. ชวน “คลินิกายภาพบำบัด” ร่วม “30 บาทรักษาทุกที่” ดูแลฟื้นฟูผู้ป่วย 4 กลุ่มโรค

infographic

“สมศักดิ์” ยาหอม อสม. มอบกยผ.ศึกษางบตั้งกองทุน- 'ค่าเสี่ยงภัยโควิด' ยังไม่ได้ แม้เสนอครม.แล้ว

"สมศักดิ์" ติดตามการดูแลผู้ป่วยจิตเวช เผย นายกฯสั่งทำ "แผนเพิ่มบุคลากรแพทย์" แก้ปมขาดแคลน

RSV คือเชื้อไวรัสอะไร ?