Nghiên cứu kiểm soát chất lượng bộ mẫu phân tích tương quan toàn bộ hệ gen

  • Nguyễn Ngọc Trung Đại học Quốc gia Thành phố Hồ Chí Minh
  • Lê Gia Hoàng Linh Đại học Y Dược Thành phố Hồ Chí Minh
  • Trần Quang Nam Đại học Y Dược Thành phố Hồ Chí Minh
  • Mai Phương Thảo Đại học Y Dược Thành phố Hồ Chí Minh
  • Hoàng Anh Vũ Đại học Y Dược Thành phố Hồ Chí Minh
  • Đỗ Đức Minh Đại học Y Dược Thành phố Hồ Chí Minh

Main Article Content

Keywords

Nghiên cứu tương quan toàn bộ hệ gen, GenomeStudio, PLINK, kiểm soát chất lượng

Tóm tắt

Mục tiêu: Các nghiên cứu tương quan toàn bộ hệ gen (GWAS: Genome-wide association study) là một công cụ rất hiệu quả để nghiên cứu vai trò của yếu tố di truyền trong các bệnh lý đa nguyên nhân phức tạp. Tuy nhiên, với số lượng các điểm đa hình đơn nucleotide rất lớn được sử dụng trong các chip microarray, việc kiểm soát chất lượng dữ liệu từ các mẫu nghiên cứu là hết sức cần thiết. Thông qua nghiên cứu này, chúng tôi đã sử dụng các kỹ thuật sinh tin học để kiểm soát chất lượng các mẫu được phân tích toàn bộ hệ gen trên 494 người bình thường và 503 bệnh nhân đái tháo đường típ 2. Đối tượng và phương pháp: 997 đối tượng nghiên cứu (bao gồm 494 người bình thường và 503 bệnh nhân đái tháo đường típ 2) được phân tích toàn bộ hệ gen (khảo sát 644.303 điểm đa hình) bằng bộ kit Infinium Global Screening Array (GSA). Bằng cách sử dụng phần mềm GenomeStudio và PLINK, chúng tôi đã kiểm soát chất lượng cho các mẫu nghiên cứu theo chất lượng mẫu, chất lượng gọi điểm đa hình, sự phù hợp giới tính, mức độ dị hợp tử, mức độ quan hệ họ hàng. Kết quả: Với ngưỡng kiểm soát chất lượng cho mẫu là tỉ lệ gọi được biến thể (CallRate) ≥ 0,98, cho các điểm đa hình là điểm GenTrain ≥ 0,7, điểm Cluster Sep Score ≥ 0,3 và điểm Call Freq ≥ 0,95, đồng thời loại trừ các mẫu có giới tính không phù hợp, có mức độ di hợp tử cao và có khả năng có quan hệ họ hàng, chúng tôi đã loại trừ 213 mẫu và 264.390 điểm đa hình không đạt chất lượng. Kết luận: Với các ngưỡng khảo sát chất lượng nêu trên, chúng tôi đã áp dụng được các tiêu chuẩn kiểm soát chất lượng đầu vào cho các mẫu dữ liệu phân tích tương quan toàn bộ hệ gen với bộ mẫu bao gồm 494 người bình thường và 503 bệnh nhân đái tháo đường típ 2. Việc kiểm soát chất lượng này rất quan trọng để việc phân tích tương quan toàn bộ hệ gen cũng như ước tính chỉ số nguy cơ di truyền đa gen đạt được tính chính xác.

Article Details