Знешне SigmoID ўяўляе сабой прыклад графічнага інтэрфейса,
напісанага ў Xojo што дае яму звыклы
знешні выгляд і зручнасць выкарыстання на ўсіх трох платформах (АС X, Linux і Windows). GUI забяспечвае інтэрфейс для праграм HMMER, MEME Suite і TransTerm HP, якія
адказваюць за выкананне адпаведных запытаў. Паслядоўнасці лога вылічаюцца WebLogo які напісаны з
выкарыстаннем Python, таму для выкарыстання SigmoID абавязкова патрабуюцца Python (версія 2.7.x) і BioPython (версія 1.64
і вышэй) для. Апрацоўка ў nhmmer, вывад mast і TransTerm HP, пераўтварэнні фарматаў паслядоўнасцяй сіквенсаў і даданні рэгуляторных
участкаў да анатацыі геному рэалізаваны ў выглядзе асобных Скрыптоў
Python . Скрыпты выклікаюцца з выкарыстаннем графічнага
інтэрфейса праграмы, але пры жаданні могуць быць выкарыстаны асобна і
інтэграваны ў склад крыніцы інфармацыі
аб анатацыі. Падрабязныя інструкцыі па ўсталяванню прыведзены ў апісанні для
кожнай платформы. Зыходны код для
ўсяго SigmoID даступны
з ліцэнзіяй GPL 2.0.
SigmoID дазваляе:
- атрымаць дадзеныя аб сайтах звязвання са спецыялізаваных баз даных;
- візуалізаваць выраўноўванне сайта звязвання лого сіквенса;
- пашыраць, скарачаць і маскіраваць выраўноўванні;
- ствараць аптымізаваныя HMM-профілі з шэрагаў паслядоўнасцяў нуклеатыдаў;
- выконваць пошук бактэрыяльных геномаў з калібраваных (і некалібраванах) HMM профіляў;
- дадаваць анатацыю прамотараў і сайтаў звязвання транскрыпцыйных фактараў у файлы геномаў у фармаце GenBank;
- рэдагаваць анатацыю геному.
Дадзеная версія
ўключае ў сябе 80 калібраваных
профіляў (для 5 сігма фактараў і 36 ТФ, аптымізаваных для энтерабактэрыяльных фітапатагенаў Pectobacterium spp. і Dickeya dadantii. Эфектыўнасць гэтых профіляў ніжэйшая
для іншых бактэрый, але яны могуць быць прыдатныя для многіх энтерабактэрый пры ўмове
рэгулявання парога адчувальнасці.
Nhmmer ажыццяўляе пошук
сайтаў звязвання і павінен быць ўсталяваны
па змаўчанні.
Дадаваць анатацыі да
GenBank файлаў можна з
дапамогай скрыпту HmmGen.py,
які можна выкарыстоўваць асобна ад
астатніх. Для гэтага
патрабуецца BioPython (версія 1.64 і вышэй).
Зараз вядома, што SigmoID працуе на АС
X (10.8-10.11), Windows (Vista, 7
і 8), Ubuntu (12.04 і 14.04). Ён таксама можа працаваць і на іншых Linux
дыстрыбутывах, пры ўмове, што есць
у наяўнасці і ўсталяваны неабходныя бібліятэкі.
SigmoID ў значнай меры абапіраецца на Python, без каторага магчымасці SigmoID значна абмяжоўваюцца. Розныя скрыпты Python, уключаныя ў
SigmoID, патрабуюць Python версіі 2.7 і не працуюць з версіяй 3. Для
сістэм Linux і OS X Python павінен быць усталяваны па змаўчанні, у
той час як карыстальнікі Windows, могуць загрузіць яго з python.org. SigmoID у значнай меры абапіраецца на Python, без каторага магчымасці SigmoID значна абмяжоўваюцца. Розныя скрыпты Python, уключаныя ў SigmoID, патрабуюць Python версіі 2.7 і не працуюць з версіяй 3. Звярніце
ўвагу, што на Windows, вам
неабходна змяніць сістэму пераменных асяроддзя PATH, каб уключыць шлях да Python. Самы просты спосаб зрабіць гэта ―абраць варыянт
" Add python.exe to path " у праграме ўсталеўкі (гэты параметр не
выбраны па змаўчанні!). Вы можаце праверыць, што пітон усталяваны правільна,
увёўшы ' python ' у камандным
радку, які павінен запусціць інтэрпрэтар Python.
Biopython (версія 1.64+) павінен быць усталяваны на Python 2.7. Вы можаце спампаваць дыстрыбутыў і азнаёміцца з інфармацыяй аб усталяванні
для вашай сістэмы на biopython.org. Калі ласка, пераканайцеся, што вы
спампавалі і ўсталявалі правільную для вашай сістэмы і Python версію.
У залежнасці ад налад вашай сістэмы, MEME можа запатрабаваць дадатковых python і perl модуляў. Калі ласка, праверце на панэлі журнала акна SigmoID паведамленні пра памылкі і ўсталюйце
адсутныя модулі, калі гэта неабходна. MEME у SigmoID можна выклікаць
двума спосабамі: як просты канвэртар з выраўнаваных паслядоўнасцяў ў MEME фармат (праз каманду меню Пераўтварыць у MEME) або для пошуку сайтаў
звязвання ў межах выраўнаваных паслядоўнасцяў (праз каманду меню Знайсці Сайты з MEME). У іншым выпадку
запускаецца вывад адказу на каманду у фармаце html праз Perl-скрыпт, які абапіраецца на файлы шаблонаў, якія MEME павінен знайсці ў пэўных месцах, таму гэты
варыянт будзе працаваць, тлькі калі MEME усталяваны на
сістэме карыстальніка і належным чынам указаны шлях да SigmoID.
Існуюць два Linux дыстрыбутывы SigmoID, для 32-бітных і 64-бітных сістэм. Абодва могуць
запатрабаваць усталявання дадатковых бібліятэк. 32-разрадная версія залежыць ад
версіі WebKit 1 для
адлюстравання вынікаў пошуку па даведцы і базах дадзеных. WebKit 1
фактычна ўваходзіць у 32-бітны варыянт Linux SigmoID; паглядзіце калі ласка файл SigmoID.sh, каб задаць правільную каманду для запуску SigmoID з уключанымі бібліятэкамі WebKit1.
SigmoID можа адкрыць два тыпа файлаў
паслядоўнасцяў нуклеаатыдаў: з паслядоўнасцямі геному і TFBS / паслядоўнасцямі
прамотараў.
Для працы з файламі анатацый у SigmoID яны павінны быць захаваны ў фармаце GenBank. У SigmoID з дапамогай каманды з меню File можна адкрыць толькі файлы ў фармаце GenBank. Бягучая версія геномнага браўзэра можа правільна адкрываць файлы толькі з адзінкавым зваротам для кожнага файла. Вы можаце выканаць nhmmer (але не MAST) пошук разбіццяў геному з некалькімі асобнымі зваротамі, але, калі ласка, не спрабуйце адкрыць гэты тып GenBank файлаў у геномным браўзэры.
SigmoID можа таксама працаваць з не анатаванай паслядоўнасцяў геному ў
фармаце FASTA. Не анатаванаы геном
ў FASTA фармаце не можа быць адкрыты непасрэдна ў геномным браўзэры, але можа быць выбраны ў
якасці мішэні для nhmmer/MAST пошуку. Вядома, фільтрацыі опцый скрыптоў пост-апрацоўкі (HmmGen.py),
якія належаць табліцы ўласцівасцяў.gbk файлаў не будуць працаваць з паслядоўнасцямі геному ў фармаце FASTA.
TFBS/прамотарныя
паслядоўнасці могуць быць як у фармаце FASTA, так і спецыяльным профільным
фармаце SigmoID (з пашырэннем .sig TFBS/прамотарныя
паслядоўнасці ў FASTA файлах
павінны быць выраўнаваны і мець аднолькавую даўжыню. Калі SigmoID сутыкаецца паслядоўнасцямі рознай
даўжыні, ен паведамляяе аб памылцы і ня
паказвае паслядоўнасць лога; сіквенсы, аднак, загружаюцца (з мэтай прагляду і /
або для выраўноўвання іх належным чынам з выкарыстаннем MAST).
Файлы спецыялізаванага фармату SigmoID (з пашырэннем .sig) уяўляюць сабой віртуальныя папкі, якія
змяшчаюць некалькі асобных файлаў: фактычныя паслядоўнасці сайтў звязвання ў FASTA фармаце, калібраваныя hmm і MEME профілі, а таксама два тэкставых файла з
апісаннем профіля і параметраў сістэм пошуку / постапрацоўкі. Змесціва файлаў у
межах .sig віртуальнай тэчцы
можна паглядзець у галоўным акне
SigmoID з дапамогай каманд з меню Від. У SigmoID есць дзве скрытыя каманды меню для пераўтварэння
рэальнай папкі ў .sig файл і
наадварот; іх можна адкрыць, калі ўтрымліваць націснутай кнопку "Alt" пры выбары ў меню Файл.
Звярніце ўвагу, што ў сувязі з бягучым
абмежаваннем Xo jo SigmoID не можа правільна працаваць з
віртуальнымі папкамі на 64-разрадных машынах, таму 64-бітная версія Linux пераўтворае ўсе файлы .sig у рэальныя папкі. Іх можна адчыніць
толькі з дапамогай панэлі інструментаў галоўнага акна і нельга праз любую
каманду меню. Таму на 64-бітнай Linux версіі, перайдзіце да бягучага профіля любой .sig папкі, якую вам патрэбна адкрыць і выкарыстоўвайце
крайнюю левую кнопку на панэлі інструментаў галоўнага акна, каб
адкрыць іх.
SigmoID можа захаваць геномныя файлы у стандартным фармаце GenBank, экспартаваць не аннатаваныя паслядоўнасці
геному ў FASTA фармат і экспартаваць табліцы
уласцівасцяў у Sequin table фармат, які патрабуе праграма NCBI
tbl2asn. Адпаведныя каманды знаходзяцца ў меню Файл.
Галоўнае акно
адкрываецца пры запуску SigmoID і падзяляецца на два асноўных элементы: Панэль Прагляду
і панэль
Журнала. Галоўнае акно адкрываецца пры запуску SigmoID і падзяляецца на два асноўных элементы: панэль прагляду і панэль журнала. Журнал
адлюстроўвае паведамленні праграмы (у
тым ліку памылкі), а таксама паказвае тэкставую выснову з каманднага радка ад
некаторых з уключаных праграм і сцэнарыяў пітона. Панэль прагляду ўтоена пры
запуску SigmoID і і адкрываецца пасля загрузкі дадзеных пра сайт
звязвання. Па змаўчанні, у ім адлюстроўваецца лога сіквенса, аднак праз меню
Від. Тып
інфармацыі, якую можна паказаць з дапамогай панэлі прагляду залежыць ад тыпу файлу,
які адкрыты: для FASTA файлаў
могуць быць паказаны толькі лога і сіквенс, у той час як для .sig файлаў даступныя ўсе опцыі. Панэль прагляду
можна выкарыстоўваць для рэдагавання паслядоўнасці сайта звязвання. У
выніку паслядоўнасць лога пералічваецца
і ўсе уласцівасці профіля становяцца несапраўднымі (гэта таксама адлюстравана ў
акне Майстар Профіля). Звярніце ўвагу, што рэдакцыія іншых тыпаў
інфармацыі (налады, апісанне, hmm профіль і г.д) у гэтым акне не будзе мець ніякага эфекту. Толькі змены,
зробленыя праз акно Майстар Профіля можна захаваць (у файле
.sig) і выкарыстаць паўторна.
Лога сіквенсу адлюстроўваецца
ў акне Прагляду
ў інтэрактыўным рэжыме, што дазваляе выбраць частку выраўноўвання. Асобную
вобласць можна абраць шляхам працягвання
курсора мышы праз лога; затым можна дадаць яшчэ вобласць(і), націснуўшы на
кнопку "Shift" і
зноў перацягнуўшы мыш праз патрэбную вобласць. Такі выбар мае два магчымых
спосабы выкарыстання. Па-першае, вы можаце захаваць паслядоўнасці, адпаведныя
абранай вобласці лога ў новым файле Fasta (з дапамогай каманды Захаваць Абраны Профіль... з меню Файл). Па-другое, вы можаце
запусціць nhmmer пошук з
абранымі часткамі маскіраванага выраўноўвання. Маскіраванне выконваецца па
змаўчанні, калі вы пачынаеце пошук пры выбары часткі выраўновання. Для гэтага
выклікаецца праграма alimask
з пакета HMMER, каб стварыць маскіраваны
профіль nhmmer, які затым
выкарыстоўваецца для пошуку патрэбнага геному. Можна задаць параметры
маскіравання ў акне канфігурацыі nhmmer. Калі ласка, звярніцеся да Кіраўніцтва для карыстальніка HMMER каб удакладніць дэталі.
На панэлі інструментаў размешчаны конпкі для некаторых функцый, якія найбольш часта выкарыстоўваюцца. Самая левая кнопка "Load
Alignment" дазваляе адкрываць файлы з дадзенымі аб сайтах звязвання як FASTA, так .sig фарматаў. Файлы .sig, якія падтырмлівае SigmoID могжна
выбраць з меню, якое выпадае пасля націску на кнопку. Іншыя файлы можна адкрыць, проста націснуўшы на гэтую
кнопку (для Linux ці Windows)
або выбраць More ... у самым нізе спісу, што выпадае (OS X).
Наступная кнопка " Search " запускае nhmmer
пошук у загружаным ў дадзены момант профілем. Першапачатковыя вынікі пошуку
адлюстроўваюцца ў панэлі журналу.
У тым выпадку, калі выкарыстоўваецца файл .sig, скрыпт пітона запускае постапрацоўку па
змаўчанні, і адкрываецца акно Геномнага Браўзэра для
адлюстравання вынікаў пошуку. Для некалібраваных профіляў
(адкрытых з FASTA файлаў) скрыпт постапрацоўкі трэба запусціць асобна, націснуўшы на кнопку " PostProcess " на панэлі прылад. Звярніце ўвагу, што зыходны
файл GenBank не змянялі і SigmoID
спытае, куды захаваць файл з
занесеннымі ў яго змяненнямі ў тым жа фармаце (GenBank).
Чацвертая кнопка на панэлі прылад " Terminators " дазваляе выконваць пошук тэрмінатараў. Гэтая функцыя выкарыстоўвае
TransTerm HP, выконвае неабходныя пераўтварэнні фармату і дадае знойдзеныя тэрмінатары да анатацыі геному. Так як пошук у TransTerm займае некаторы час, вынікі могуць з'явіцца толькі праз некалькі хвілін, у
залежнасці ад даступнай вылічальнай магутнасці.
Пятая кнопка "Palindromise" робіць простую рэч - яна рэверсіруе камплементарныя паслядоўнасці загружаных ў дадзены момант сайтаў звязвання, дадае іх да загружаных дадзеных і
пералічвае лога паслядоўнасці. Выкарыстанне гэтай функцыі мае сэнс толькі для
загадзя вядомых паліндромных сайтаў і асабліва карысна, калі даступна толькі некалькі сіквенсаў. Пры пошуку з паліндрамізаваным профілем, неабходна абавязкова праверыць сцяжок " Palindromic ". Нельга выкарыстоўваць гэтую функцыю разам
з MEME (паколькі сама MEME робіць падобную рэч). Просьба таксама пазбягаць выкарыстання гэтай функцыі перад захаваннем калібраванага профіля праз акно Майстры профіля, так як
ўстаноўка сцяжка " Palindromic " у акне Майстар профіля робіць тое
ж самае (і ў канчатковым рахунку кожы сіквенс дублюецца).
Усе каманды геномнага пошуку таксама даступныя з меню Геном.
Апошняя кнопка на панэлі, " Settings " дазваляе ўсталеўваць шлях да
праграм у камандным радку і ключавых скрыптоў, якія выкарыстоўваюцца ў графічным інтэрфейсе.
Гэта акно адкрываецца пасля пошуку сайтаў звязвання, і яго можна
выкарыстоўваць для хуткага агляду знойдзеных сайтаў звязвання. Альбо браўзэр можна выкарыстоўваць для прагляду
GenBank файла, які ужо існуе, без выкарыстання функцыі пошуку. Акно падзелена на
тры часткі, якія адлюстроўваюць табліцу ўласцівасцяў (зверху), паслядоўнасць, якая даследуецца з
шасцю рамкамі трансляцыы
(у сярэдзіне) і вынікі пошуку (у ніжняй частцы). Табліца ўласцівасцяў інтэрактыўная, на ей можна выбраць патрэбную функцыю, націснуўшы на яе мышшу, або частку адлюстраванага франмента геному, шляхам працягвання праз яго курсора мышы. Абраную паслядоўнасць можна скапіяваць у
буфер абмену, каб выкарыстоўваць для запуску пошуку ў
базе дадзеных, каб змяніць або выдаліць. Адпаведныя каманды знаходзяцца ў
кантэкстным меню (з’яўляецца пасля пстрычкі правай кнопкай мышы па аб'екце карты); вы можаце таксама двойчы пстрыкнуць па функцыі, каб рэдагаваць яе. Звярніце ўвагу, што ў
гэтым акне браўзэр не правярае фармат файлу: будзьце асцярожныя, прытрымлівайцеся фармату GenBank! Двайная пстрычка па-за
любых функцыянальных цэнтраў наносіць на карту дадатковую ўласцівасць на абраныя
клікам каардынаты.
Пошук
у базе дадзеных можна запусціць з дапамогай кантэкстнага меню. У
залежнасці ад бягучага выбару меню будзе ўтрымліваць каманды для пошуку (з
BLAST) супраць nr базы дадзеных або (з hmmer / BLAST) супраць баз дадзеных SwissProt / UniProt /
CDD. Так як серверы NCBI часцей за ўсе перагружаны, hmmer пошукі ў SwissProt / UniProt звычайна працуюць намнога хутчэй.
Вынікі пошуку адлюстроўваюцца ў ніжняй частцы акна, якое па сутнасці
з'яўляецца спрошчанай версіяй
вэб-браўзэра. Самую простую навігацыю (Назад / Наперад / Перазагрузіць) можна ажыццяўляць з дапамогай кантэкстнага меню.
Панэль інструментаў, размешчаную ў верхняй частцы
гэтага акна, можна
выкарыстоўваць для навігацыі па выніках апошняга hmmer/mast пошуку(стрэлкі злева); клавішы "стрэлка налева"
і "стрэлка направа" на клавіятуры
таксама можна выкарыстоўваць для
навігацыі. Абраную паслядоўнасць можна захаваць як тэкставы файл (у фармаце
FASTA) з дапамогай адпаведнай
каманды з меню Геном. Сцяжок
справа ад гэтага элемента кіравання можна выкарыстоўваць, каб выключыць
непажаданыя хіты пры
захаванні. Панэль інструментаў таксама дазваляе павялічыць / паменшыць карту
функцый (самы правы элемент кантролю са знакамі +/-) і праводзіць пошук у геноме. "Разумнае" поле пошуку можа вылучаць тры тыпу запытаў
(паслядоўнасці, каардынаты або тэкставае апісанне функцый)
і выконвае пошук у адпаведнасці з тыпам запыту. Пераход да наступнага выніку
пошуку ажыццяўляецца праз спалучэнне Control-G (Command-G для сістэмы mac) або каманды з меню Геном.
Вокны RegPrecise and RegulonDB забяспечваюць доступ
да адпаведных баз даных з інфармацыяй аб рэгулятарах. Гэтыя вокны маюць
падобную арганізацыю і рэжым выкарыстання. Большую частку кожнага акна займае
спіс рэгулятараў. Паколькі RegulonDB змяшчае інфармацыю толькі для E. coli, рэгулятары адлюстроўваюцца адразу, у той
час як у выпадку RegPrecise
вы павінны спачатку абраць патрэбны від (з акна, якое ўсплывае над спісам). У
верхняй частцы акна RegulonDB можна выбіраць паміж сайтамі звязвання фактараў транскрыпцыі і
сігма-фактарам і фільтраваць сайты ў адпаведнасці з узроўнем дакладнасці
прыкмет.
Пасля націску на рэгулятар ў спісе адбываецца актывацыя
функцыянальныхкнопак ў ніжняй частцы акна. Крайняя левая кнопка (з літарай
"i") адрасуецца да
базы дадзеных і адлюстроўвае інфармацыю аб рэгулятары ў новым акне.
Кнопка Check TF Presence, знаходзіцца справа ад кнопкі інфармацыі і можа быць
выкарыстана для праверкі наяўнасці фактару транскрыпцыі ў адкрытым зараз
геноме. Калі адкрытага геному няма, кнопка будзе адключана. Гэтая кнопка
падключаецца да адпаведнай базы дадзеных, каб атрымаць амінакіслотную
паслядоўнасць рэгулятара, а затым запускае tfast x пошук у геноме, які зараз
адкрыты. Тры верхнія хіты гэтага пошуку адлюстроўваюцца на панэлі журнала
галоўнага акна. Паколькі ўзроўні падабенства сярод геномаў моцна адрозніваюцца,
карыстальніка сам ацэньвае іх значнасць. Тут можа быць карысным зваротнае
пацверджанне: трэба скапіяваць каардынаты
самага лепшага хіта, знайсці адпаведную ORF ў геномным браўзэры і запусціць phmmer пошук у SwissProt / UniProt, каб убачыць, ці будуць зыходны TF і яго артолаг збліжацца, як галоўныя хіты.
Звярніце ўвагу, што шлях да файла з геномам не павіннен утрымоўваць
прабелы! Гэта звязана са спосабам апрацоўкі варыянтаў у tfastx.
Кнопка Regulon Logo знаходзіцца ў правым ніжнім куце акна і можа быць выкарыстана для загрузкі
дадзеных аб сайце звязвання для абранага рэгулятара і адлюстравання яго лога ў
галоўным акне. Акно RegPrecise змяшчае дадатковую кнопку для адлюстравання лога сайтаў звязвання для
адпаведнага рэгулога. У залежнасці ад колькасці сайтаў, даступных для
рэгулятара і іх разнастайнасці, больш зручна выкарыстоўваць адну з гэтых кнопак.
Гэтае акно дазваляе ўвесці параметры, неабходныя
для стварэння адкалібраванага профіля. У верхняй левай частцы акна знаходзіцца
спіс парогавых значэнняў, з якіх строга патрабуецца толькі nhmmer gathering threshold, як яно выкарыстоўваецца nhmmer па змаўчанні. Каманда Find Minimal Score значна спрашчае выбар правільнага
парогавага значэння, так як яна знаходзіць мінімальны бал для сайтаў звязвання
ў ў спецыяльнай навучальнай паслядоўнасці. Хоць іншыя два супыны nhmmer (і mast p-value threshold) не патрабуюцца для захавання
калібраванага .sig файлу, усе
ж пажадана указаць занчэнні і для іх.
Увод правільных параметраў для постапрацоўкі ў
правым верхнім куце гэтага акна мае вырашальнае значэнне для стварэння
правільных дапаўненняў да анатацыі геному. Сцяжок Palindromic site ўсталеўвае адпаведныя параметры пры
запуску MEME і MAST і фільтруе вынікі, атрыманыя для паліндромных сайтаў, якія
перакрываюцца, пасля пошуку nhmmer. Праверка з
опцыяй Use
next locus_tag збірае разам
і прыкмету локуса,які вывучаецца, і
спецыфікацыі наступнага гена, калі гэта магчыма (гэтыя спецыфікацыі не будуць
дададзеныя, калі сайт звязвання размешчаны паміж генамі, якія транскрыбуюцца
па-рознаму). Опцыя Ignore sites within ORFs можа значна паменшыць
колькасць неспецыфічных хітоў для "шумных" профіляў. Выкарыстанне
гэтай опцыі, аднак, патрабуе асцяржнасці, паколькі есць рызыка выдаліць
некаторых са спецыфічных хітоў, асабліва гэта датычыцца рэпрэссараў. Тэкст, уведзены ў поле protein name выкарыстоўваецца ў якасці значэння для
запатрабаванага класіфікатара bound_moiety пры даданні
сайтаў да анатацыі геному
Апісанне
профіля павінна быць уведзена ў тэкставым полі ў ніжняй частцы акна. Яно
патрэбна, каб актываваць кнопку Захаваць ... і нясе інфармацыю аб крыніцы
дадзеных і апісанне працэсу канструявання профіля.
Калі адкрыць створаны .sig файл, усе налады з гэтага файла ўводзяцца ў палях Майстры профіля. Тым не менш, гэтыя значэнні будуць выдаленыя пры рэдагаванні выраўноўванняў паслядоўнасцяў. Калі вы хочацепазбегнуць гэтага, націсніце на кнопку Lock, размешчаную ў правым ніжнім куце гэтага акна.
Гэтае прастое акно адкрываецца ў большасці выпадкаў перад запускам утыліты каманднага радка (nhmmer, meme, mast, TransTerm HP) і скрыптоў python, для змянення некаторых параметраў. Варыянты, спадзяюся, зразумелыя, але тлумачэнне ў большасці выпадкаў можна атрымаць праз тэгі даведкі: неабходна трымаць курсор мышы на опцыі на працягу секунды, каб убачыць гэтую даведку.
Самае простае акно вэб-браўзэра выкарыстоўваецца для адлюстравання
інфармацыі з баз дадзеных RegPrecise і RegulonDB, а таксама
адказу на запыты па даведкам SigmoID. Калі гэта здаецца нязручным, спасылка можна скапіяваць (праз кантэкстнае
меню) і адкрыць у іншым браўзэры на ваш выбар.
Гэта акно можна адкрыць з дапамогай
каманды Prefereces ... у
меню SigmoID (OS X),у меню Праўка (Windows / Linux) або націснуўшы крайнюю правую кнопку на панэлі
інструментаў ў галоўным акне. Кнопкі ў верхняй частцы гэтага акна перключаюцца
паміж трыма панэлямі налад. Панэлі дазваляюць:
1) вызначаць шлях да выкананых файлаў (nhmmer, meme, mast і г.д.), якія выкарыстоўваюцца SigmoID. Гэта можа быць карысна, калі SigmoID не можа знайсці некаторыя з неабходных праграм або калі вы хочаце
выкарыстоўваць тыя, што ужо ўсталяваныя ў вашай сістэме. Вы таксама можаце
скінуць ўсе шляхі па змаўчанні (накіроўваюць да файлаў, якія распаўсюджваюцца
з SigmoID) з дапамогай кнопкі ў левым ніжнім куце гэтага
акна.
2) Усталяваць базы дадзеных, якія знаходзіь BLAST і
абмежаваць пошук да меншай таксанамічнай групы, каб паскорыць працэс. Гэтая
панэль таксама дазваляе пераключаць два фарматы выніку пошуку для HMMER вэб-сервера: поўны графічна багаты HTML фармат (па змаўчанні) і просты тэкставы
фармат. Звярніце ўвагу, што фармат HTML павінен быць падтрыманы html драйверам вашай сістэмы (якая выкарыстоўваецца SigmoID), але гэта не абавязкова. У прыватнасці, ні адна з версій Internet Explorer здаецца не здольна адлюстроўваць html вывад HMMER сервера па змаўчанні, як і WebKit 1.0, які выкарыстоўваецца SigmoID на 32-бітнай Linux. Таму
на Windows і 32-бітнай Linux выккарыстоўваецца звычайны тэкставы
фармат.
3) SigmoID забяспечвае пераключэнне з адной у іншую папку з
калібраваным профілям. Толькі профілі з гэтай папкі будуць даступныя праз
крайнюю левую кнопку на панэлі інструментаў у галоўным акне. Толькі гэтыя
профілі могуць быць выкарыстаны функцыяй Scan Genome.
Гэтае меню ўтрымлівае стандартныя каманды
адкрыцця і захавання файлаў, падзеленыя на тры групы.
Самая верхняя група змяшчае каманды для працы з з выраўноўваннямі / профілямі,
наступная – з геномнымі файламі.
Адкрыць Профіль...
Адлюстроўвае дыялог адкрыцця файла, у якім можна
выбраць профайл / файл выраўноўвання з лакальнага дыска. SigmoID можа адкрываць файлы ў сваім уласным фармаце (.sig) або тэкставыя файлы ў фармаце FASTA. Файл павінен мець адно з наступных
пашырэнняў: .sig, .fasta, .fas, .fsa, .fa.
Захаваць Профіль Як...
становіцца даступнай, калі уносяцца змены ў
паслядоўнасцьсайта звязвання. Гэтая каманда не захоўвае змены непасрэдна пасля
іх увядзення, а адкрывае Майстру Профіля, які дазваляе ўвесці новыя параметры профіля
і захаваць выраўноўванне ў .sig файле. Калі вы хочаце захаваць паслядоўнасці толькі у FASTA фармаце, калі ласка, выкарыстоўвайце
наступную каманду
Захаваць
вылучэнне профіля...
захоўваецца (у фармаце FASTA) частка профіля, адпаведная абранай частцы лога
паслядоўнасці.
Захаваць Выяву Лога...
захоўвае выяву лога у выглядзе малюнку ў фармаце PNG.
Закрыць
Закрывае бягучае акно. Не можа закрыць галоўнае акно.
Адкрыць Геном...
Адлюстроўвае дыялог адкрыцця файла, у якім можна выбраць файл геному з лакальнага дыска. Файл павінен быць у фармаце GenBank і мець .gb або .gbk пашырэнне.
Захаваць геном...
Захоўвае адкрыты ў
дадзены момант ў
акне браўзэра файл пад тым жа
імем.
Захаваць Геном Як...
Захоўвае
адкрыты ў дадзены момант ў акне браўзэра геномны файл з іншым імем файла.
Экспартавць паслядоўнасць ДНК...
Экспарт змесціва бягучага геному ў выглядзе простага тэкставага файла ў фармаце FASTA. Гэта не тычыцца табліцы ўласцівасцяў.
Экспартавць бялковыя паслядоўнасцi...
Экспарт бялковых паслядоўнасцей кожнай рамкi чытання бягучага геному ў выглядзе простага тэкставага файла ў фармаце FASTA.
Экспартаваць Табліцу Ўласцівасцяў...
Табліца ўласцівасцяў экспартеццаў фармаце табліцы
GenBank. Атрыманы .tbl файл можа быць выкарыстаны для падрыхтоўкі артыкула GenBank з дапамогай tbl2asn.
Выхад
Закрывае ўсе вокны SigmoID і цалкам выходзіць з SigmoID. Пры выбары гэтай опцыі з
незахаваным профілем або геномам,
SigmoID спачатку спытае вас, ці захаваць змены.
Адмена
Адмяняе апошняе дзеянне рэдагавання зробленае ў бягучым актыўным тэкставым полі. Нажаль, Адмена недаступная для змен, якія былі зроблены ў геномных файлах.
Выразаць
Выконвае капіяванне абранага тэксту ў
буфер абмену і
выдаляе яго з
зыходнага становішча.
Капіяваць
Капіюе вылучаны тэкст у буфер абмену. У
акне геномнага браўзэра гэтая каманда капіюе паслядоўнасць нуклеатыдаў.
Капіяваць Амінакіслотную Паслядоўнасць
Калі ў дадзены момант ў геномным браўзэры выбраны CDS, гэтая каманда капіюе яго амінакіслотную
паслядоўнасцьў буфер абмену.
Уставіць
Ўстаўляе ў бягучай пазіцыі курсора тэкст з буфера
абмену, скапіяваны з дапамогай каманд выразаць або скапіяваць.
Ачысціць
Выдаляе выдзлены
тэкст.
Выбраць усе
Выбірае ўвесь тэкст у бягучым
тэкставым полі
Параметры
Адкрывае акно налад, каб
змяніць параметры SigmoID. Зараз дазваляе толькі задаваць шлях да выкананых файлаў.У OS X гэта падменю знаходзіцца ў меню SigmoID.
Гэта меню можна
выкарыстоўваць для змены інфармацыі, якая адлюстроўваецца ў Галоўным
Акне і ў Геномным
Браўзэры. Толькі
апошняя каманда, Праглядзець Дэталі, звязана з Геномным
Браўзэрам. Астатнія
каманды звязаны з выглядам галоўнага акна і пераключаюць тып інфармацыі, якая
адлюстроўваецца ў верхняй частцы панэлі Прагляду. Гэта меню дазваляе
праглядаць змесціва ўсіх кампанентаў .sig файла (на самай справе з’яўляецца віртуальнай папкай, якая змяшчае шэсць
тэкставых файлаў). Рэдагаванне сіквенса можа ажыццяўляць непасрэдна ў акне
прагляду, у той час як астатнюю частку інфармацыі можна рэдагаваць толькі з дапамогай
Майстры Профілю.
Лога
Адлюстроўвае паслядоўнасць лога для паслядоўнасці
адкрытага ў дадзены момант .sig або FASTA файла (або паслядоўнасці, якая загружана з баз
дадзеных RegPrecise RegulonDB). У цяперашні час лога разлічваецца з выкарыстаннем арыгінальнай формулы
Т. Шнайдэра (1986) без карэкцыі ўзору.
Паслядоўнасці
Паказвае паслядоўнасці нуклеатыдаў для загружаных
дадзеных аб сайце звязвання. Вы можаце рэдагаваць паслядоўнасці ў такім
выглядзе, але калі вы хочаце выкарыстоўваць адрэдагаваныя дадзеныя ў далейшым,
вам неабходна пераключыцца ў рэжым прагляду лога, так як у гэтым выпадку
праграма дапрацоўвае ваша рэдагаванне і
пералічвае лога і профіль hmm.
Інфармацыя Пра Профіль
Апісанне профіля, якое дадзена аўтарам. Даступны
толькі для дадзеных з .sig файлаў.
Hmm-профіль
Калібраваны профіль hmm
створаны
hmmbuild пры стварэнні файла
.sig. Даступны толькі для дадзеных з .sig
файлаў.
MEME data
Той жа сіквенс ў фармаце MEME. Выкарыстоўваецца для пошуку ў MAST. Даступны толькі для
дадзеных з .sig файлаў.
Налады Профіля
Розныя налады, у тым ліку профілі каліброўкі парогу і параметраў постапрацоўкі. Даступны толькі для
дадзеных з .sig файлаў.
Схаваць Прагляднік
хаваецца
/ паказваецца пры дапамозе каманды Від ў галоўным акне, каб паікуць больш / менш месца
для панэлі журналу.
Праглядзець Дэталі
паказвае
/ хавае адлюстраванне паслядоўнасці з шасцю рамкамі трансляцыі ў акне геномнага
браўзэра.
Пашырыць Сайты Звязвання...
Адкрывае невялікае акно, у якім можна адзначыць левую і
правую межы пашырэння, а таксама геномны файл для
пошуку. Гэтая каманда знаходзіць кожную паслядоўнасць сайта звязвання ў адкрытай на дадзены момант паслядоўнасці геному і дадае адзначаную колькасць нуклеатыдаў налева і
направа. Вынікі запісваюцца ў журнал.
Пераўтварыць у Stockholm-фармат
Пераўтварае бягучы профіль ў мінімальны фармат Stockholm (у
адпаведнасці з патрабаваннямі hmmbuild) і выводзіць вынікі ў
панэлі Журнал.
Пераўтварыць у Hmm-фармат
Запускае hmmbuild з пакета HMMER, каб стварыць профіль hmm, які можа быць выкарыстаны ў
якасці ўваходных дадзеных для nhmmer.
Пераўтварыць у MEME-фармат
Працуе з загружаным ў дадзены момант сіквенсам сайта звязвання і выводзіць вынікі ў выглядзе звычайнага тэксту на
панэлі Журнал. Гэтыя вынікі могуць быць выкарыстаны ў якасці ўваходных дадзеных MAST (на самай справе, калі MAST працуе з некалібраванымі дадзенымі Meme першыя дзеянні
пргаграмы такія ж)
Знайсці Сайты З Дапамогай MEME...
Паказвае
акно, якое дазваляе наладзіць параметры MEME. Для гэтай каманды MEME настроена для атрымання вынікаў у фармаце
html, якія адлюстроўваюцца ў
акне Вэб-браўзэра. This Гэтая
каманда можа быць карысная пры працы з дадзенымі, для якіх не правадзілі выраўнованне, напрыклад, дадзеныя з RegulonDB..
Нажаль, каманда пакуль не даступна ў SigmoID для Windows. Калі ласка, выкарыстоўвайце каманду Пераўтварыць у MEME-фармат , якая запускае тое ж дзеянне, але выводзіць просты тэкст напанэль журналу ў галоўным акне.
Майстар Профіля...
Адкрые акно Майстар Профіля , якое дазваляе ўводзіць параметры для каліброўкі профіля, а затым захоўваць яго ў выглядзе файла .sig.
Першыя два пункты гэтага меню
забяспечваюць доступ да баз дадзеных з інфармацыяй пра Рэгулон. База дадзеных RegPrecise ўтрымлівае
інфармацыю высокай якасці для сайтаў звязвання розных бактэрый у той час як RegulonDB з'яўляецца спецыялізаванай базай дадзеных рэгулона E. coli. Хаця для эфектыўнага выкарыстання інфармацыі з RegulonDB у большасці выпадкаў патрабуецца выкананне дадатковых
дзеянняў
у гэтай базе маюцца дадзеныя аб рэгулятарах,
якія адстутнічаюць у RegPrecise.
Пры выкарыстанні дадзеных з RegulonDB геномаў, адрозных ад геному E.
coli, было б мэтазгодна праверыць на прысутнасць артолага транскрыбцыйнага фактару ў геноме, які вывучаецца. Гэта можна ажыццявіць з дапамогай каманды Check TF Presence.
RegPrecise...
Адкрывае акно, якое
прадастаўляе доступ да базы дадзеных RegPrecise .
RegulonDB...
Адкрывае акно,
якое прадастаўляе доступ да
базы дадзеных RegulonDB .
Об рэгулоне
Адкрывае
вэб-старонку RegPrecise або RegulonDB з інфармацыяй для рэгулона, абранага ў адным з вокнаў
баз дадзеных.
Паказаць Лога
Паказвае
лога сайта звязвання для абранага рэгулятара ў галоўным акне SigmoID. Вынік можа
быць выкарыстаны для nhmmer/ mast пошуку дадзеных RegPrecise. Сайты звязвання ў RegulonDB часта зрушаная, і ў гэтым выпадку можа (ці не можа) быць карыснай каманда Find Sites
з MEME
з меню Profile.
Праверыць рэгулятар
Гэтая каманда атрымлівае сіквенс рэгулятарнага
бялку з RegulonDB і запускае tfastx пошук для параўнання яго з бягучым адкрытым геномам. Тры лепшыя вынікі пошуку tfastx адлюстроўваюцца на панэлі журналу ў галоўным
акне SigmoID. Мы рэкамендуем праводзіць дадатковую праверку
лепшшага хіта з дапамогай каардынатаў, каб знайсці яго ў бягучым геноме і
запусціць phmmer пошук у
базе дадзеных SwissProt, у выніку якга (у выпадку наяўнасці
артолага) арыгінальны рэгулятар будзе прыведзены як лепшы хіт для E. coli. На дадзены момант гэтая каманда
недаступная для RegPrecise,
так як няма простага спосабу атрымання сіквенсу рэгулятара з гэтай базы
дадзеных.
Знайсці Мінімальную Адзнаку
Можа быць карысна пры вызначэнні парогаў
параметраў пошуку. Гэтая каманда можа быць зададзена толькі тады, калі пошук nhmmer толькі што быў запушчаны і яго вынікі
адлюстроўваюцца ў акне браўзэра геному. Гэтая функцыя проста параўноўвае
бягучыя хіты з навучальным наборам (арыгінальныя сайты звязвання адкрыты ў
галоўным акне), выводзіць самы нізкі бал сярод навучальнага набору і спіс
прапушчаных хітоў. Самы нізкі спецыфічны і самы высокі неспецыфічны балы
таксама ўводзяцца як парогавыя значэнні даверу і шумавых парогаў nhmmer у акно Майстар Профіля. Калі гэты парог шуму
аказваецца ніжэй, чым зборны, іх сярэдняе значэнне выводзіцца ў гэтым акне ў
якасці зборнага парога (у адваротным выпадку значэнне ўводзіцца парога даверу).
На самай справе, для
далейшых пошукаў будзе выкарыстоўвацца зборны парог. У залежнасці ад зыходных дадзеных і
геному, які вывучаецца, такі
просты падыход можа выбраць ня правільныя
значэнні. Вы ўсё яшчэ павінны
грунтоўна праверыць, што гэта тыя
ацэнкі якія вам патрэбны!
Таксама звярніце ўвагу, што гэтая каманда не можа знайсці сайты з устаўкамі нуклеатыдаў і наадварот, з
адсутнасцю нуклеатыдаў.
У гэтым меню сабраны каманды, звязаныя з
празай з генам і
ў асноўным арыентаваныя на розныя спосабы пошуку нарматыўнай інфармацыі ў адкрытым ў дадзены момант геному.
nhmmer Пошук...
Адкрывае акно, якое дазваляе наладзіць і запусціць nhmmer ― асноўную пошукавую сістэму ў
SigmoID. Гэтая функцыя ўключаецца, калі загружаны дадзеныя аб сайце звязвання (і паслядоўнасць лога сайта адлюстравана ў галоўным акне). Для таго, каб запусціць пошук, вы павінны выбраць файл з паслядоўнасцю геному ў фармаце GenBank і абярыце значэнне зрэзу (мае вырашальнае значэнне для атрымання правільных вынікаў). Калі загружаны адкалібраваны профіль,
то правільнае значэнне будзе
абрана аўтаматычна. Вынікі
пошуку адлюстроўваюцца на панэлі Журналу. Калі вы
ўпэўненыя, што выбранае значэнне
зрэзу з'яўляецца правільным, вы можаце выбраць сцяжок "Дадаць анатацыю ў геном", які запусціць скрыпт пітона HmmGen.py для
фільтрацыі вынікаў nhmmer пошуку, дадасць сайты звязвання да анатацыі геному і адкрые абноўленую
паслядоўнасць геному ў акне Геномнага Браўзэра. In У тым выпадку, калі калібраваны профіль (.sig файл) ужо адкрыты, гэты скрыпт
запускаецца па змаўчанні. Для некалібраваных профіляў (адкрытых з FASTA файлаў)
сцэнарый для постапрацоўкі неабходна запускаць асобна з дапамогай каманды Annotate Current Sites.
Дадаць Сайты Да Анатацыі...
Адкрывае акно, якое дазваляе наладзіць
і запусціць скрыпт Python (HmmGen.py) для фільтрацыі вынікаў
nhmmer, дадаваць сайты звязвання да анатацыі геному і адкрываць
абноўленую паслядоўнасць геному ў акне Геномнага Браўзэра. Гэтую каманду зручна выкарыстоўваць асобна ад nhmmer пошуку
для працы з не аптымізаванымі профілямі, калі трэба вызначыць правільныя параметры пошуку.
Гэтая каманда не змяняе
зыходны файл GenBank, а стварае новы файл з унесенымі дапаўненнямі (і пытаецца, дзе яго
захаваць)..
Пошук MAST...
Адкрывае акно, якое дазваляе запускаць MAST з пакета MEME
Suite. Звярніце ўвагу, што MAST ня быў так старанна пратэставаны ў SigmoID, як nhmmer. Акно налады забяспечвае наладу толькі мінімальныай колькасці параметраў (у асноўным, толькі адзін - р-значэнне супыну), але дазваляе ўводзіць дадатковыя параметры, калі гэта неабходна. Іх можна дадаць ў канец каманднага радка MAST. Калі адкрыты некалібраваны профіль, спачатку запускаецца
MEME для пераўтварэння паслядоўнасці сайта звязвання ў
патрабаваны фармат. Неапрацаваныя вынікі пошуку (і вынік работы MEME, у выпадку запуску апошняга) адлюстроўваюцца на панэлі Журнал. З дапамогай сцяжкоў ў ніжняй частцы гэтага акна можна загадаць
SigmoID паказваць вынікі пошуку, адфільтраваныя з выкарыстаннем скрыпта постапрцоўкі (MastGen.py) у акне Геномнага Браўзэра са зменай або
без змены анатацыі.
Пошук Тэрмінатараў...
Адкрывае акно, якое дазваляе наладзіць і
запусціць TransTerm HP для пошуку тэрмінатараў. Гэтая каманда выконвае ўсе неабходныя пераўтварэнні фармату і дадае тэрмінатары да анатацыі геному (выкарыстоўвае скрыпт TermGen.py).
Вынікі пошуку могуць з’явіцца
толькі праз неклькі хвілін пасля запуску, так як TransTerm патрабуецца некаторы час, каб выканаць заданую
каманду ў залежнасці ад
даступнай вылічальнай магутнасці.
Сканаваць Геном...
Гэтая
каманда прызначана для выканання поўнага сканавання геному па ўсіх даступных калібраваных профілях пры мінімальным узаемадзеянні з карыстальнікам. Вы можаце выбраць патрэбныя профілі (або выкарыстоўваць іх усе) і вырашаць, ці
будзе выконвацца пошук тэрмінатару. Пасля націску на кнопку Run, SigmoID запускае nhmmer пасля скрыпта HmmGen.py з усімі праверанымі профілямі і выкарыстоўвае ўжо настроеныя пасля
пошуку тэрмінатараў параметры. Вынікі будуць запісаныя ў абраны вамі файл у фармаце GenBank. Запуск гэтай функцыі можа заняць нейкі час, калі
папярэдне было выбрана многа профіляў.
Захаваць Правераныя Сайты...
Захоўвае ў тэкставы файл (у фармаце FASTA) хіты з апошняга пошуку, якія ў дадзены момант адлюстраваныў браўзеры геному. Каб пазбегнуць захавання непажаданых хітоў, можна выкарыстоўваць сцяжок
справа ад навігацыйных стрэлак на панэлі інструментаў браўзэра.
Пералічыць Рэгулоны...
Выводзіць на панэльі журнала галоўнага акна
які-небудзь адзін рэгулон (пад кантролем абранага рэгулятара) або ўсе
рэгулоны ў геноме, які вы анатуеце. Регулоны паслядоўна выводзяцца ў выглядзе спісу
аперонаў / дывергонаў, якія знаходзяцца пад кантролем рэгулятара. Для выканання
гэтай каманды аперон вызначаецца як паслядоўнасць генаў паміж сайтам звязвання
і бліжэйшым тэрмінатарам або доўгім прамежкам паміж генамі. Два аперона, якія
транскрыбуюцца у розных напрамках, выводзяцца ў выглядзе адзінага дывергона з
сайтам звязвання рэгулятара ў сярэдзіне. Акно налады, якое адкрываецца з
дапамогай гэтай каманды дазваляе выбраць крытэрыі для вызначэння пачатку оперона.
Знайсці
Гэтая каманда проста змяшчае
курсор у поле пошуку акна геномнага браўзэра, размешчанага ў яго верхнім правым куце. У полі пошуку
можна вылучыць тры тыпу запытаў (паслядоўнасці, каардынаты або тэтставае апісанне функцыі) і выканаць пошук у адпаведнасці з
тыпам запыту. Увядзіце інфармацыю
для пошуку і націсніце "Enter" на клавіятуры для запуску. У геноме будзе выдзелена становішча першага выніку запыту.
Знайсці Ізноў
Вылучае ў геноме наступную
пазіцыю вынікаў папярэдняга
пошукавага запыту.
Дадаць Графік...
Гэтая каманда можа быць
выкарыстана для пабудовы небудзь дадзеных па пакрыццю РНК-сіквенса,
вырабленыя samtools
(глядзіце інструкцыі)
або простых лікавых дадзеных (напрыклад,% GC). У вобласці пабудовы графіка можна змясціць чатыры
графікі, якія перасякаюцца - проста выкарыстоўвайце
каманду Дадаць Графік... паўторна. Усе графікі паказаны для той вобласці, якая
дазваляе, напрыклад, параўноўваць дадзеныя
РНК-паслядоўнасці для двух
умоў і для абедзвух ланцугоў.
Кожны ўчастак у цяперашні момант часу маштабуецца па асобнасці, так што прыведзеныя на графіку максімальныя значэння (паказаны на малюнку злева і справа), варта
ўлічваць пры супастаўленні графікаў.
Выдаліць Графік
Ну, ён выдаляе ўсе ўчасткі, якія адлюстроўваны
Аб’яднаць Дадзеныя Графіка...
Гэта дадатковая каманда, якую можна выкарыстоўавць для
аб'яднання двух файлаў дадзеных, атрыманых з
дапамогай каманды samtools. Гэтая аперацыя неабходна для правільнага адлюстравання дадзеных РНК-сіквенса у адпаведнасці з гэтымі інструкцыямі.
Адлюстроўвае спіс усіх адкрытых у
дадзены момант вокан SigmoID. Пасля выбару акна з гэтага спісу, яно з’яўляецца па-над астатнімі вокнамі.
Аб SigmoID
Адлюстроўвае акно з
інфармацыяй аб SigmoID, уключаючы цякучую вэрсію і кароткі спіс рэсурсаў.
Даведка SigmoID
Адкрывае акно прагляду даведкі.
HMMER
User Guide
Адкрывае (па змаўчанні ў сродку прагляду PDF) кіраўніцтва карыстальніка HMMER з дыстрыбутыва
HMMER пакета.
Hmmer.org
Адкрывае вэб-сайт HMMER ў акне вэб-браўзэра.
Вэб-партал MEME Suite
Адкрывае галоўны вэб-сайт MEME
Suite, у акне вэб-браўзэра.
могуць быць вельмі карысныя для праверкі
рэгуляторных паслядоўнасцяў і межаў оперона. У цяперашні час, SigmoID не мае ўсіх
функцый, неабходных для гэтага, і можа толькі загружаць і адлюстроўваць
прачытаныя значэння адліку. Яны могуць быць атрыманы рознымі спосабамі, адзін з
якіх (не абавязкова лепшы) апісаны ніжэй. Такі падыход патрабуе bowtie2 для чытання і стварэння карты і samtools для апрацоўкі файла з вынікамі.
Ніжэй прыведзены каманды для атрымання неабходных файлаў у выпадку
спараных чытанняў. Перамыкачы -p 8 і - @ 8 запускаюць задачы bowtie і samtools на васьмі-ядзрных працэсарахадрэгулюйце
іх для вашай сістэмы.
Для выканання прыведзеных ніжэй каманд мяркуецца, што геномны файл называецца 'genome.fasta' і дадзеныя РНК-сіквенса знаходзяцца ў
файлах 'read1.fastq' і 'read2.fastq'.
1. Індэксаваць ваш
Геномны файл:
bowtie2-build genome.fasta genome_index
2. Картаваць чытанні вашай паслядоўнасці:
bowtie2 -x genome_index -p 8 --very-sensitive-local --no-mixed --no-discordant -1 read1.fastq -2 read2.fastq -S mapped.sam
3. Пераўтварыць sam у bam, сартаваць і індэксаваць яго
samtools view -bS -@ 8 mapped.sam | samtools sort -@ 8 - mapped.bam
samtools index mapped.bam mapped.bai
4. Зняць счытванне: змясціўшы значэнне
якасці за 2 (калі карта больш чым для адной лакалізацыі)
samtools view -b -q 2 -@ 8 mapped.bam > mapped2.bam
5. Падзяліць sam файл у чытанне
картавання на сэнсавую і антысэнсавую ніці. Так як удзельнікі парнага счытвання нанесены на карту ў розных ніцях і samtools не можа атрымаць іх у адзін і той жа час, неабходна
запускаць samtools чатыры разы:
samtools view -b -@ 8 -f 99 mapped2.bam > sense1.bam
samtools view -b -@ 8 -f 147 mapped2.bam > sense2.bam
samtools view -b -@ 8 -f 83 mapped2.bam > antisense1.bam
samtools view -b -@ 8 -f 163 mapped2.bam > antisense2.bam
(звярніце ўвагу: да -f дадаюцца тры
дадатковых біта,за выключэннем неадлюстраванага прачытання і прачытання, якое няправільна супастаўляена, што не патрабуецца ў
дадзеным канкрэтным выпадку (але і не прычыняе шкоды)
6. Падлічыць прачытанні:
samtools depth sense1.bam > sense1.depth
samtools depth sense2.bam > sense2.depth
samtools depth antisense1.bam > antisense1.depth
samtools depth antisense2.bam > antisense2.depth
7. Адкрыйце файл з геномам у SigmoID і аб'яднайце прачытання разлічаныя для сэнсавай і
антысэнсавай нітак з дапамогай каманды Merge Plot Data... з меню Геном.
8. Загрузіце аб'яднаныя дадзеныя, разлічаныя для сэнсавай ніці з дапамогай каманды Дадаць Графік... з меню геному, а затым загрузіце дадзеныя для антысэнсавай ніці з дапамогай той жа каманды меню.
Паўтарыце гэтыя дзеянні для іншага прыкладаў.
The scripts described below process output produced
by various search programmes, perform format conversions and add features to
genome annotation. The scripts are called by SigmoID GUI when necessary, but
can be used separately if desired. Type the command below in terminal to get
help on command line usage:
python <path_to_the_script> -h
SigmoID processes nhmmer results (table of hits) with
the help of the HmmGen.py python
script, adding corresponding feature annotations to the genbank file being
searched and saving the result in a new file. Some useful options are provided
to make annotation more convenient. These you can find in the "HmmGen Settings" window, which pops up
after clicking the "Postprocess"
button in the main window.
To run the script, enter the appropriate threshold (either
bit score or E-value). By default SigmoID chooses the same value that was used
to run nhmmer, but you can increase the bit score or decrease the
E-value to reduce the number of hits without re-running nhmmer.
To filter out all intragenic hits, check the "Consider
intergenic regions only" box. nhmmer
reports hits on both strands, and in the case of palindromic sites there will
be two hits with the same coordinates and identical (or very close) scores. To
remove one of the duplicate sites, check the "Palindromic site"
checkbox.
This script can also add 'locus_tag' and 'gene' qualifiers
to the feature being annotated, but please note that GenBank will object such
additions if you later decide to submit this sequence to the database. If you
are certain you really want this addition, check the "Add qualifier"
box.
Choose feature type ("promoter" or
"protein_bind") from the "Feature to add:" box (or
just type in the valid feature type). The window also allows to
configure one qualifier for this feature. The qualifier name could be
typed in, but it should remain as 'protein_bind' in most cases. A valid protein
name should be entered in the field to the right.
Pressing the Run
button will ask you for the name of the file in which you'd like to save the
genome sequence with modified annotation. If the "Show hits in genome
browser" box is checked, You'll see the results
in the browser window. The script also appends the detailed text report to the
log pane.
This script allows to add
features to a genbank file according to MAST results. From SigmoID it is called
when
usage:
MastGen <report_file> <input_file> <output_file> [options]
positional arguments:
report_file path to MAST report file produced with -tblout option.
input_file path to input GenBank file.
output_file path to output GenBank file.
optional arguments:
-h, --help show this help message and exit
-L <integer>, --length <integer>
final feature's length in genbank file
-q [<key#"value"> [<key#"value"> ...]], --qual [<key#"value"> [<key#"value"> ...]]
add this qualifier to each annotated feature.
-p, --palindromic filter palindromic sites.
-n, --name don't pick 'locus_tag' and 'gene' qualifiers from the
next CDS feature.
-V <float or integer>, --pval <float or integer>
threshold E-Value.
-S <float or integer>, --score <float or integer>
threshold Bit Score.
-i, --insert don't add features inside CDS
-d, --duplicate no duplicate features with the same location and the
same protein_bind qualifier value
-v, --version show program's version number and exit
-f <"feature key">, --feature <"feature key">
feature key to add (promoter, protein_bind etc.)
This script allows to add
terminators to a genbank file according to TransTerm HP results.
usage:
TermGen <input_file> <output_file> [options]
positional arguments:
input_file path to input GenBank file.
output_file path to output GenBank file.
optional arguments:
-h, --help show this help message and exit
-o <path>, --output <path>
redirects TransTerm HP output file to directory given
-C <integer>, --confidence <integer>
threshold Score.
--minstem <integer> Stem must be n nucleotides long
--minloop <integer> Loop portion of the hairpin must be at least n long
--maxlen <integer> Total extent of hairpin <= n NT long
--maxloop <integer> The loop portion can be no longer than n
-v, --version show program's version number and exit
This script allows to convert genbank file into
.ptt file format.
usage:
Genbank to PTT converter <input_file>
positional arguments:
input_file path to input Genbank file.
optional arguments:
-h, --help show this help message and exit
-v, --version show program's version number and exit
This script finds putative operons between regulator
binding sites and/or terminators/long intergenic gaps.
usage:
OperOn <input_file> [options]
positional arguments:
input_file path to input GenBank file.
optional arguments:
-h, --help show this help message and exit
-g <int>, --gap <int>
minimal gap between operons
-i <int>, --indent <int>
maximal distance from binding site to the first
downstream CDS
-t, --terminator terminators are regarded as operon separator
-r <name of regulator>, --regulator <name of regulator>
only specified regulators are considered
-p, --palindromic treat all binding sites as palindromic
-s, --strict operon stops on first terminator (if -t is set)
-v, --version show program's version number and exit
This script allows to convert GenBank file into
.tbl file format. The resulting table is output to stdout.
usage:
Genbank to .tbl converter <input_file> [options]
positional arguments:
input_file path to input GenBank file.
optional arguments:
-h, --help show this help message and exit
-f, --fasta creates fasta from genbank file.
-p PREFIX, --prefix PREFIX
sequencing centre prefix.
-t, --translation adds translation qualifier to CDS features in .tbl
-v, --version show program's version number and exit