швидке секвенування мікробних геномів відкриває двері у функціональній геноміки

“Мікробні дослідження геному та її застосування” була тема 35-й Хенфорда симпозіум з охорони здоров’я і навколишнього середовища, що відбулася 21-24 жовтня 1996 року в Richland, Washington.1 За словами учасників, геноми цілих 100 мікроорганізмів, як очікується, бути повністю або частково секвенований рубежі century.2 Головне питання під час зустрічі була, як ми маємо справу з, інтерпретувати і використовувати всі ці нові дані?

Зустріч стала також звіт про стан цілого генома мікробної послідовності і на перші спроби використовувати цю інформацію. Повна 3,6-Mb послідовність для ціанобактерії Synechocystis Sp. PCC6803 повідомив Хироказу Котана (Kazusa DNA інституту, Японія). 3 Повідомлялося про досягнення прогресу для бліда спірохета, збудник сифілісу (George Вайншток, Техаський університет медичної школи); гіпертермофільнимі архею Pyrobaculum aerophilum (Jeffrey Miller, Університет Каліфорнії в Лос-Анджелесі); Pyrococcus furiosus, термофільні архею (Роберт Вайс , Університет штату Юта) і гіпертермофільнимі Eubacterium Aquifex VF5 (Рон Суонсон, рекомбінантні біокаталізу, Inc.)

Виступи та дискусії також зосереджені на методи для створення клонів для секвенування, різні способи ідентифікації генів і генних функцій і баз даних.

визначення функції гена

Вибух інформації з проектів геному породила ряд зусиль, деякі з них координується, розвивати легкодоступних баз даних, які дійсно корисні для окремих наукових дослідників. Сесія під головуванням Росс Overbeek (Argonne National Laboratory) розглянули деякі з цих спроб і їх основні проблеми. Важливим завданням є, щоб коментувати завершена геномів зі швидкістю, порівнянної з генерацією необроблені дані про послідовність.

Оуен Білий [Інституту геномних досліджень (ТИГР)], описуючи спеціалізованих власного програмного забезпечення, щоб допомогти визначити зсувом рамки помилки, зазначив, що проблеми стеження може призвести до втрати інформації, коли дані переміщаються між проектами або в різних відомствах. Він описав, як, для деяких метаболічних шляхів, для ключових генів білків-ферментів не може бути знайдений. Це тому, що мікроб не вистачає ферменту, або це у зв’язку з неможливістю визначити відповідні відкриті рамки зчитування (ОРС)?

Overbeek зазначив інші проблеми, покладаючись на послідовність гомології для ідентифікації генів. Він привів у приклад випадок, в якому ферменти загальні гомологию послідовності, але належали до непов’язаним метаболічних шляхів. Щоб визначити ці проблеми, Overbeek і Нільса Ларсена (Michigan State University) пов’язують ці генні списки відомих метаболічних шляхів на веб-сайт під назвою ВІТ-4, яка замінює колишній сайт PUMA.

Інші використовують різні комп’ютерного підходи до визначення ORFS з невідомою функцією. Моніка Райлі (Вудс-Холі океанографічного інституту) припустили, що гени, що кодують ферменти повинні бути розбиті на функціональні області, перш ніж вони відносяться до баз даних. Ферменти можуть проявляти різні функції шляхом кодування кілька функціональних доменів в одному білка або шляхом комплексоутворення декількох білкових субодиниць різного призначення. Домен замовлення може бути перемішуються і ще привести аналогічно функціонуючі фермент, який б не розпізнаються, якщо вся послідовність гена були зіставлені. Використання доменного підхід Райлі могли б запропонувати додаткові функції для ферментів, що володіють тільки одна відома функція (див. с. 6 Більш детальна інформація про підхід Райлі).

Основний доповідач J.Craig Вентер (ТИГР) був одним з числа учасників, які висловили стурбованість з приводу наслідків поганого контролю за якістю введення даних загальнодоступних баз даних. Ще одне питання було, скільки часу має пройти між визначенням послідовності та осадження в публічній базі даних для спонсорованих урядом проектів. Деякі учасники підтримували негайної здачі на зберігання нової інформації для створення і підтримки конкурентного середовища та мінімізації комерційних переваг фірм оплачуються федеральним спонсорів придбати послідовності. Інші вважали, що більший ризик архівування погані дані будуть супроводжувати його осадження без деяких попередніх заходів забезпечення якості.

Лабораторія проблеми

Інноваційна робота в лабораторії, безумовно, є необхідною для перевірки гіпотез запропоновані методи в кремнії і шукати функції, пов’язані з невідомими ОРС. Новий підхід до ідентифікації був представлений Георгіївської церкви (Harvard Medical School), який розповів про розвиток геномно Engineered Мультиплекс вибору (так званий GEMS) для вимірювання одночасно виживання ефекти в рамці делеції в генах багатьох в багатьох середовищах. Щоб визначити конкретні гени необхідні при даному наборі умов, кожен ген видалено в кадрі, мутанти об’єднують, і мутант втрати контролюється в процесі росту при різних умовах культури.

Деякі функціонально еквівалентні ферментами еволюціонували незалежно один від одного і, таким чином кодуються генами з неспоріднені послідовності. Джей Короткі (рекомбінантний біокаталізу) описав високопродуктивного скринінгу стратегії, в якій загальна геномну ДНК екстрагують з навколишнього середовища, клоновані, і тестували на експресію ферментативні функції інтересу. В результаті басейн генних послідовностей (“екологічна бібліотека”) для білки здатні виконувати одну функцію. Колективного геномів архівірувані в рекомбінантної формі з використанням клонування вектори, що містять кишкової палички F-фактор ініціації реплікації, що дозволяє високоякісний реплікації 40 – 300 кб клонованих фрагментів ДНК. Як приклад потенціал цієї інноваційної концепції з коротким повідомила про виявлення раніше невідомих архей генів РНК гелікази, який відповідає за АТФ-залежні зміни вторинної структури РНК і глутамат полуальдегіда амінотрансферази, який бере участь у початкових етапах синтезу гема.

Інші, такі як Gerben Zylstra (Rutgers University) приймають альтернативний підхід до виявлення ферменти з унікальними послідовностями. Інтерес Zylstra знаходиться в шляхів, що беруть участь у деградації ароматичних сполук, але той же підхід може бути застосований до інших шляхів. При виборі в відсутність гібридизації з набором зондів для всіх представницьких ферментів як відомо, бере участь в певному шляху, Zylstra успішно визначити унікальний ферменти збагачення ароматичного вуглеводню, що руйнують бактерій з забрудненого навколишнього середовища.

майбутні проблеми

Ханс Петер Кленка (ТИГР) обговорив доповідь у Science5, що більшість (62%) передбачив білок-кодують генів у Methanococcus jannaschii геному з невідомою функцією. Доповіді вказується на побоювання, що основні припущення використовуються для призначення ймовірні функції ОРС повинні бути ретельно зважені. Таким чином, описані вище підходи приведуть до послідовностей генів, функція частку, але не обов’язково послідовності, що підкреслює основні точки, щоб з’явитися з-симпозіум, що необхідно дотримуватися обережності при інтерпретації результатів від потоку інформації про послідовність приміщенням у суспільне надбання .

Зворотне також була shown6 для дуже різних послідовностей, що кодують не пов’язані первинні структури білків, в результаті яких аналогічні функції. (Університет штату Іллінойс) Презентація Гері Олсен на використанні послідовності інформації (в першу чергу послідовностей рРНК), щоб виводити філогенію продемонстрував необхідність ретельного розгляду подібності послідовності для інших цілей, крім прогнозування ген-функції продукту.

Багато вчені пророкують, що наявність десятків повних послідовностей мікробної є серйозним проривом у фундаментальній біології, які, звичайно, призведе до нових способів наближається промислової мікробіології та боротьбі з інфекційними захворюваннями. Без адекватних інструментів для управління інформацією або планів для визначення пріоритетності постійно скорочуючи фінансові ресурси для науки, однак, багато може піти нереалізованою, і багато з переваг може бути відкладено довше, ніж необхідно.