Прејди на содржината

KEGG

Од Википедија — слободната енциклопедија
KEGG
Содржина
Контакт
Пристап
Алатки
Разно
KEGG
Содржина
Контакт
Пристап
Алатки
Разно

KEGG збирка бази на податоци што се занимаваат со, биолошки патеки.KEGG се користи за истражување и едукација на, вклучително и анализа на податоците вогеномиката, метагеномиката, метаболиката и другите студии на омики, моделирање и симулација во и истражување на превод во развојот на лекови .

Проектот за база на податоци KEGG беше инициран во 1995 година од Минору Канехиса, професор на Институтот за хемиски истражувања, универзитет во Кјото, во рамките на тогашната тековна јапонска програма за човечкиот геном .[1][2] Предвидувајќи ја потребата за компјутеризиран ресурс што може да се користи за биолошка интерпретација на податоците за секвенци на геноми, тој започнал да ја развива базата на податоци KEGG PATHWAY. Тоа е збирка мануелно нацртани мапи на патеки KEGG кои претставуваат експериментално знаење за метаболизмот и разни други функции на клетката и организмот . Секоја мапа на патеката содржи мрежа на молекуларни заемодејства и реакции и е дизајнирана да ги поврзе гените во геномот (претежно белковини ) на патеката. Ова ја овозможи анализата наречена мапирање на патеката KEGG, при што содржината на генот во геномот се споредува со базата на податоци на KEGG PATHWAY за да се испита кои патеки и придружните функции веројатно ќе бидат кодирани во геномот.

Според програмерите, KEGG е „компјутерска репрезентација“ на биолошкиот систем .  Интегрира градежни блокови и жични дијаграми на системот - поточно, генетски градежни блокови на гени и белковини, хемиски градежни блокови на ситни молекулии и реакции, и жични дијаграми на молекуларна интеракција и мрежни реакции. Овој концепт се реализира во следните бази на податоци на KEGG, кои се категоризираат на системи, геномски, хемиски и здравствени информации.[3]

  • Информации за системи
    • ПАТВЕЈ - мапи на патеки за функции на клеточни и организми
    • МОДУЛ - модули или функционални единици на гените
    • БРИТЕ - хиерархиска класификација на биолошки ентитети
  • Геномски информации
    • ГЕНОМ - комплетни геноми
    • ГЕНИ - гени и белковини во целосните геноми
    • ОРТОЛОГИЈА - ортологни групи на гени во целосните геноми
  • Хемиски информации
  • Здравствени информации
    • БОЛЕСТ - човечки заболувања
    • ДРAГ - одобрени лекови
    • ЕНВИРОН - сурови лекови и супстанции поврзани со здравјето

Бази на податоци

[уреди | уреди извор]

Информации за системи

[уреди | уреди извор]

Базата на податоци на KEGG PATHWAY, базата на податоци за дијаграмот за жици, е јадрото на ресурсот KEGG. Тоа е збирка патеки мапи кои интегрираат многу субјекти, вклучително гени, белковини, РНК, хемиски соединенија, гликани и хемиски реакции, како и гени на болести и цели на лекови, кои се чуваат како поединечни записи во другите бази на податоци на KEGG. Мапите на патеката се класифицираат во следниве делови:

Делот за метаболизам содржи естетски нацртани глобални карти, кои покажуваат целосна слика за метаболизмот, покрај редовните мапи на метаболички патеки. Глобалните мапи со ниска резолуција можат да се користат, на пример, за да се споредат метаболичките капацитети на различни организми во студиите за геномика и различни примероци од животната средина во студиите за метагеномика. Спротивно на тоа, KEGG модулите во базата на податоци KEGG MODULE се локализирани дијаграми за жици со поголема резолуција, што претставуваат построги функционални единици во картата на патеката, како што се под патеките конзервирани меѓу специфичните групи на организми и молекуларни комплекси. KEGG модулите се дефинирани како карактеристични генски множества што можат да се поврзат со специфични метаболички капацитети и други фенотипски одлики, така што ќе можат да се користат за автоматско толкување на податоците за геномот и метагеномот.

Друга база на податоци што ја надополнува KEGG PATHWAY е базата на податоци на KEGG BRITE. Тоа е онтолошка база на податоци што содржи хиерархиски класификации на различни ентитети, вклучувајќи гени, белковини, организми, болести, лекови и хемиски соединенија. Додека KEGG PATHWAY е ограничен на молекуларни заемодејства и реакции на овие субјекти, КЕГГ БРИТЕ вклучува многу различни типови на врски.

Геномски информации

[уреди | уреди извор]

Неколку месеци по започнувањето на проектот КЕГГ во 1995 година, бил објавен првиот извештај за комплетно секвенцираниот бактериски геном.[4] Оттогаш, сите објавени целосни геноми се акумулираат во KEGG и за еукариотите и за прокариотите . Базата на податоци KEGG GENES содржи информации на ниво на гени / белковини и базата на податоци на KEGG GENOME содржи информации на ниво на организмот за овие геноми. Базата на податоци KEGG GENES се состои од генски сетови за целосни геноми, а на гени во секој сет им се дадени прибелешки во форма на воспоставување кореспонденции со дијаграмите за жици од мапите на патеките KEGG, модулите KEGG и BRITE хиерархиите.

Овие преписки се направени со употреба на концептот на ортолози . Мапите на патеката KEGG се подготвени врз основа на експериментални докази во специфични организми, но тие се дизајнирани да бидат применливи и за други организми, затоа што различни организми, како што се човекот и глувчето, честопати споделуваат идентични патишта што се состојат од функционално идентични гени, наречени ортолошки гени или ортолози. Сите гени во базата на податоци KEGG GENES се групирани како ортолози во базата на податоци на KEGG ORTHOLOGY (KO). Бидејќи на јазлите (генските производи) на мапите со патеки KEGG, како и модулите KEGG и BRITE хиерархиите, им се даваат идентификатори на КО, кореспонденциите се воспоставуваат откако гените во геномот се анонираат со идентификаторите КО со постапката за анотација на геном во KEGG.[3]

Хемиски информации

[уреди | уреди извор]

Мапите за метаболички патеки на KEGG се подготвени да ги претставуваат двојните аспекти на метаболичката мрежа: геномската мрежа за тоа како геномните кодирани од ензимите се поврзани со катализацијата на последователните реакции и хемиската мрежа за тоа како хемиските структури на подлоги и производи се трансформираат со овие реакции.[5] Збир на ензимски гени во геномот ќе ги идентификува мрежните мрежни ферментирања кога се надредени на мапите на патеката KEGG, кои, пак, ги карактеризираат мрежите за трансформација на хемиската структура, што овозможуваат интерпретација набиосинтетички и биоразградливи потенцијали на организмот. Алтернативно, збир на метаболити идентификувани во метаболот ќе доведе до разбирање на ензимските патеки и гените на ензимот.

Базите на податоци во категоријата хемиски информации, кои колективно се нарекуваат KEGG LIGAND, се организираат со опфаќање на знаењето за хемиската мрежа. Во почетокот на KEGG проектот, KEGG LIGAND се состоеше од три бази на податоци: KEGG COMPOUND за хемиски соединенија, KEGG REACTION за хемиски реакции и KEGG ENZYME за реакции во номенклатурата на ензимите.[6] Во моментов, постојат дополнителни бази на податоци: KEGG GLYCAN за гликани [7] и две помошни бази на податоци за реакција наречени RPAIR (усогласување на парните реактанти) и RCLASS (реакција класа).[8] KEGG COMPOUND, исто така, се прошири да содржи различни соединенија, како што се ксенобиотици, покрај метаболитите.

Здравствени информации

[уреди | уреди извор]

Кај KEGG, заболувањата се сметаат како нарушени состојби на биолошкиот систем предизвикани од вознемирувачи на генетски фактори и фактори на животната средина, а лековите се сметаат за различни видови на растројувачи.[9] Базата на податоци на KEGG PATHWAY ги вклучува не само нормалните состојби, туку и нарушените состојби на биолошките системи. Сепак, мапите на патеките на болеста не можат да се подготват за повеќето болести затоа што молекуларните механизми не се добро разбрани. Алтернативен пристап е земен во базата на податоци KEGG DISEASE, која едноставно ги катализира познатите генетски фактори и факторите на заболувања во животната средина. Овие каталози на крајот може да доведат до поцелосни дијаграми на жици на болести.

Базата на податоци KEGG DRUG содржи активни состојки на одобрени лекови во Јапонија, САД и Европа. Тие се одликуваат со хемиски структури и / или хемиски компоненти и се поврзани со целни молекули, метаболизирачки ензими и други информации за молекуларна интеракција во мапите на патеките KEGG и хиерархиите BRITE. Ова овозможува интегрирана анализа на заемодејства со лекови со геномски информации. Сурови лекови и други супстанции поврзани со здравјето, кои се надвор од категоријата на одобрени лекови, се чуваат во базата на податоци на KEGG ENVIRON. Базите на податоци во категоријата здравствени информации се колективно наречени KEGG MEDICUS, кој исто така вклучуваат пакет-инсерти на сите продадени лекови во Јапонија.

Модел на претплата

[уреди | уреди извор]

Во јули 2011 година, KEGG вовел модел на претплата за преземање FTP, како резултат на значителен прекин на владиното финансирање. KEGG продолжува да биде достапен слободно преку своето мрежно место, но моделот на претплата покрена дискусии за одржливоста на базите на податоци за биоинформатика.[10][11]

Поврзано

[уреди | уреди извор]
  • База на податоци за компаративна токсикогеномика - CTD ги интегрира KEGG патеките со токсикогеномички и податоци за болести
  • ConsensusPathDB, молекуларна функционална база на податоци за интеракција, со интегрирање на информации од KEGG
  • Генетска онтологија
  • PubMed
  • Uniprot
  • База на податоци за болести на гените
  1. „KEGG: Kyoto Encyclopedia of Genes and Genomes“. Nucleic Acids Res. 28 (1): 27–30. 2000. doi:10.1093/nar/28.1.27. PMC 102409. PMID 10592173.
  2. Kanehisa M (1997). „A database for post-genome analysis“. Trends Genet. 13 (9): 375–6. doi:10.1016/S0168-9525(97)01223-7. PMID 9287494.
  3. 3,0 3,1 „Data, information, knowledge and principle: back to metabolism in KEGG“. Nucleic Acids Res. 42 (Database issue): D199–205. 2014. doi:10.1093/nar/gkt1076. PMC 3965122. PMID 24214961.
  4. „Whole-genome random sequencing and assembly of Haemophilus influenzae Rd“. Science. 269 (5223): 496–512. 1995. Bibcode:1995Sci...269..496F. doi:10.1126/science.7542800. PMID 7542800.
  5. Kanehisa M (2013). „Chemical and genomic evolution of enzyme-catalyzed reaction networks“. FEBS Lett. 587 (17): 2731–7. doi:10.1016/j.febslet.2013.06.026. PMID 23816707. |hdl-access= бара |hdl= (help)
  6. „LIGAND database for enzymes, compounds and reactions“. Nucleic Acids Res. 27 (1): 377–9. 1999. doi:10.1093/nar/27.1.377. PMC 148189. PMID 9847234.
  7. „KEGG as a glycome informatics resource“. Glycobiology. 16 (5): 63R–70R. 2006. doi:10.1093/glycob/cwj010. PMID 16014746.
  8. „Modular architecture of metabolic pathways revealed by conserved sequences of reactions“. J Chem Inf Model. 53 (3): 613–22. 2013. doi:10.1021/ci3005379. PMC 3632090. PMID 23384306.
  9. „KEGG for representation and analysis of molecular networks involving diseases and drugs“. Nucleic Acids Res. 38 (Database issue): D355–60. 2010. doi:10.1093/nar/gkp896. PMC 2808910. PMID 19880382.
  10. „The 2012 Nucleic Acids Research Database Issue and the online Molecular Biology Database Collection“. Nucleic Acids Res. 40 (Database issue): D1–8. 2012. doi:10.1093/nar/gkr1196. PMC 3245068. PMID 22144685.
  11. Hayden, EC (2013). „Popular plant database set to charge users“. Nature. doi:10.1038/nature.2013.13642.

Надворешни врски

[уреди | уреди извор]