Các nhà nghiên cứu tại Viện Salk đã tạo ra một bước đột phá trong lĩnh vực di truyền học khi phát triển công cụ ShortStop, sử dụng công nghệ học máy để khám phá các vùng DNA thường bị bỏ qua trong quá trình tìm kiếm các microprotein có thể đóng vai trò quan trọng trong bệnh tật. Công cụ này không chỉ giúp các nhà khoa học xác định các vùng DNA có khả năng mã hóa microprotein mà còn dự đoán khả năng sinh học của chúng, từ đó tiết kiệm thời gian và chi phí đáng kể trong việc tìm kiếm các microprotein liên quan đến sức khỏe và bệnh tật.

ShortStop hoạt động dựa trên nguyên tắc phân loại microprotein thành hai loại: chức năng và không chức năng. Quá trình phân loại này dựa trên dữ liệu huấn luyện thu được từ các bộ dữ liệu ngẫu nhiên được tạo ra bởi máy tính. Bằng cách so sánh các microprotein tìm thấy với các mẫu giả, ShortStop có thể nhanh chóng xác định liệu một microprotein mới có khả năng chức năng hay không. Điều này đánh dấu một sự tiến bộ đáng kể trong lĩnh vực di truyền học, khi mà việc xác định các microprotein chức năng có thể đóng vai trò quan trọng trong việc hiểu rõ hơn về các cơ chế bệnh lý.
Khi áp dụng ShortStop vào một bộ dữ liệu đã được công bố trước đó, các nhà nghiên cứu đã thành công trong việc xác định 8% microprotein có khả năng chức năng, và ưu tiên chúng cho việc theo dõi tiếp theo. Điều đáng chú ý là công cụ này cũng giúp xác định các microprotein bị bỏ qua bởi các phương pháp khác, bao gồm cả một microprotein đã được xác nhận bằng cách phát hiện trong các tế bào và mô của con người. Điều này cho thấy tiềm năng của ShortStop trong việc mở rộng kiến thức về các microprotein và vai trò của chúng trong sinh học.
ShortStop đã được sử dụng để phân tích dữ liệu di truyền từ các khối u phổi của con người và mô lân cận bình thường, nhằm tạo ra danh sách các microprotein tiềm năng chức năng. Trong số các microprotein mà ShortStop tìm thấy, một số nổi bật đã được biểu hiện nhiều hơn trong mô khối u hơn mô bình thường, cho thấy chúng có thể đóng vai trò là dấu ấn sinh học hoặc microprotein chức năng cho ung thư phổi. Việc xác định các microprotein liên quan đến ung thư phổi này chứng minh giá trị của ShortStop và học máy trong việc ưu tiên các ứng viên cho nghiên cứu và phát triển điều trị trong tương lai.
Các nhà nghiên cứu hy vọng rằng ShortStop sẽ giúp họ tìm ra các microprotein mới liên quan đến sức khỏe và bệnh tật, từ đó mở ra những con đường mới cho việc chẩn đoán và điều trị các bệnh như ung thư và Alzheimer. Với khả năng phân tích và dự đoán tiên tiến, ShortStop đang trở thành một công cụ không thể thiếu trong lĩnh vực di truyền học và nghiên cứu bệnh lý, mang lại kỳ vọng cho việc phát triển các phương pháp điều trị mới và hiệu quả hơn trong tương lai.