關于序列操作(zuò)套件V2

序列操作(zuò)套件是用(yòng) JavaScript 1.5 編寫的,它是一種輕量級、跨平台、面向對(duì)象的腳本語言。 JavaScript 現(xiàn)在由 ECMA(歐洲計(jì)算(suàn)機制造商協會(huì))标準化。 ECMA 标準的第一個版本記錄在 ECMA-262 規範中。 ECMA-262 标準也(yě)被 ISO(國際标準組織)批準爲 ISO-16262。 JavaScript 1.5 與 ECMA-262 第 3 版完全兼容。

提交到(dào)序列操作(zuò)套件的序列不會(huì)離開(kāi)您的計(jì)算(suàn)機,而是由執行 JavaScript 的 Web 浏覽器進行操作(zuò)。 序列操作(zuò)套件由 Paul Stothard(加拿大(dà)阿爾伯塔大(dà)學)編寫。 将問題和(hé)意見發送至stothard@ualberta.ca

 

以下(xià)是組成序列操作(zuò)套件的程序的簡短描述:

 

格式轉換:

結合 FASTA - 将多個 FASTA 序列記錄轉換爲單個序列。 例如,當您希望使用(yòng)接受單個序列作(zuò)爲輸入的程序來(lái)确定序列集合的密碼子使用(yòng)情況時(shí),請(qǐng)使用(yòng)組合 FASTA。

EMBL 到(dào) FASTA - 接受一個或多個 EMBL 文(wén)件作(zuò)爲輸入,并以 FASTA 格式返回每個文(wén)件的 DNA 序列。 當您希望從(cóng) EMBL 文(wén)件中快(kuài)速删除所有非 DNA 序列信息時(shí),請(qǐng)使用(yòng)此程序。

EMBL 特征提取器 - 接受一個或多個 EMBL 文(wén)件作(zuò)爲輸入,并讀取特征表中描述的序列特征信息。 程序提取或突出顯示相關的序列段,并以 FASTA 格式返回每個序列特征。 當您希望從(cóng)包含許多内含子的基因組序列中提取 cDNA 序列時(shí),EMBL 特征提取器特别有用(yòng)。

EMBL反式提取器 - 接受一個或多個 EMBL 文(wén)件作(zuò)爲輸入,并以 FASTA 格式返回文(wén)件中描述的每個蛋白(bái)質翻譯。 當您對(duì) DNA 序列的預測蛋白(bái)質翻譯比 DNA 序列本身更感興趣時(shí),可以使用(yòng) EMBL Trans Extractor。

DNA過濾器 - 從(cóng)文(wén)本中删除非 DNA 字符。 當您希望從(cóng)序列中删除數字和(hé)空(kōng)格以使其适用(yòng)于其他(tā)應用(yòng)程序時(shí),請(qǐng)使用(yòng)此程序。

過濾蛋白(bái)質 - 從(cóng)文(wén)本中删除非蛋白(bái)質字符。 當您希望從(cóng)序列中删除數字和(hé)空(kōng)格以使其适用(yòng)于其他(tā)應用(yòng)程序時(shí),請(qǐng)使用(yòng)此程序。

GenBank 到(dào) FASTA - 接受一個或多個 GenBank 文(wén)件作(zuò)爲輸入,并以 FASTA 格式返回每個文(wén)件的完整 DNA 序列。 當您希望從(cóng) GenBank 文(wén)件中快(kuài)速删除所有非 DNA 序列信息時(shí),請(qǐng)使用(yòng)此程序。

GenBank 特征提取器 - 根據 GenBank 發行說明(míng)中概述的規則,接受一個或多個 GenBank 文(wén)件作(zuò)爲輸入,并讀取特征表中描述的序列特征信息。 程序提取或突出顯示相關的序列段,并以 FASTA 格式返回每個序列特征。 當您希望從(cóng)包含許多内含子的基因組序列中提取 cDNA 序列時(shí),GenBank 特征提取器特别有用(yòng)。

GenBank 反式提取器 - 接受一個或多個 GenBank 文(wén)件作(zuò)爲輸入,并以 FASTA 格式返回文(wén)件中描述的每個蛋白(bái)質翻譯。 當您對(duì) DNA 序列的預測蛋白(bái)質翻譯比 DNA 序列本身更感興趣時(shí),應該使用(yòng) GenBank Trans Extractor。

一到(dào)三 - 将單字母翻譯轉換爲三字母翻譯。

範圍提取器 DNA - 接受一個或多個 DNA 序列以及一組位置或範圍。 與位置或範圍相對(duì)應的堿基以單個新序列、一組 FASTA 記錄、大(dà)寫文(wén)本或小(xiǎo)寫文(wén)本的形式返回。 使用(yòng) Range Extractor DNA 獲取使用(yòng)位置信息的子序列。

範圍提取器蛋白(bái)質 - 接受一個或多個蛋白(bái)質序列以及一組位置或範圍。 與位置或範圍相對(duì)應的殘基以單個新序列、一組 FASTA 記錄、大(dà)寫文(wén)本或小(xiǎo)寫文(wén)本的形式返回。 使用(yòng) Range Extractor Protein 獲取使用(yòng)位置信息的子序列。

反向補碼 - 将 DNA 序列轉化爲其反向、互補或反向互補序列。 支持整個 IUPAC DNA 字母表,并保持每個輸入序列字符的大(dà)小(xiǎo)寫。 如果序列在反向鏈上(shàng)包含 ORF,您可能(néng)希望使用(yòng)該序列的反向補碼。

分裂密碼子 - 将編碼序列分成三個新序列,每個序列由三個密碼子位置之一的堿基組成。

拆分 FASTA - 将 FASTA 序列記錄劃分爲您指定大(dà)小(xiǎo)的更小(xiǎo)的 FASTA 序列。 可選的重疊值可用(yòng)于創建重疊的序列。

三到(dào)一 - 将三個字母的翻譯轉換爲單字母的翻譯。 數字和(hé)空(kōng)格會(huì)自(zì)動删除。 非标準三元組被忽略。

窗戶提取器 DNA - 接受一個或多個 DNA 序列以及位置和(hé)窗口大(dà)小(xiǎo)。 位于窗口中的堿基以新序列、大(dà)寫文(wén)本或小(xiǎo)寫文(wén)本的形式返回。 使用(yòng) Window Extractor DNA 獲取使用(yòng)位置信息的子序列。

窗口提取器蛋白(bái) - 接受一個或多個蛋白(bái)質序列以及位置和(hé)窗口大(dà)小(xiǎo)。 位于窗口中的殘基以新序列、大(dà)寫文(wén)本或小(xiǎo)寫文(wén)本的形式返回。 使用(yòng) Window Extractor Protein 獲取使用(yòng)位置信息的子序列。

 

序列分析:

密碼子圖 - 接受 DNA 序列并生成由每個密碼子的水(shuǐ)平條組成的圖形圖。 條的長度與您輸入的密碼子頻率表中的密碼子頻率成正比。 使用(yòng)密碼子圖查找可能(néng)表達不佳的 DNA 序列部分,或查看(kàn)密碼子使用(yòng)表的圖形表示(通過使用(yòng)由每種密碼子類型之一組成的 DNA 序列)。

密碼子使用(yòng) - 接受一個或多個 DNA 序列并返回每種密碼子類型的數量和(hé)頻率。 由于該程序還比較了(le)編碼相同氨基酸(同義密碼子)的密碼子的頻率,因此您可以使用(yòng)它來(lái)評估序列是否顯示出對(duì)特定同義密碼子的偏好(hǎo)。

CpG 群島 - 使用(yòng) Gardiner-Garden 和(hé) Frommer (1987) 描述的方法報(bào)告了(le)潛在的 CpG 島區(qū)域。 使用(yòng)以 1 bp 間隔在序列中移動的 200 bp 窗口進行計(jì)算(suàn)。 CpG 島定義爲 Obs/Exp 值大(dà)于 0.6 且 GC 含量大(dà)于 50% 的序列範圍。 窗口中 CpG 二聚體的預期數量計(jì)算(suàn)爲窗口中“C”的數量乘以窗口中“G”的數量,除以窗口長度。 CpG 島經常出現(xiàn)在脊椎動物基因的 5' 區(qū)域,因此該程序可用(yòng)于突出顯示基因組序列中的潛在基因。

DNA 分子量 - 接受一個或多個 DNA 序列并計(jì)算(suàn)分子量。 序列可以被視(shì)爲雙鏈或單鏈,以及線性或環狀。 計(jì)算(suàn)分子拷貝數時(shí)使用(yòng) DNA 分子量。

DNA 模式查找 - 接受一個或多個序列以及搜索模式,并返回與該模式匹配的站(zhàn)點的數量和(hé)位置。 搜索模式被編寫爲 JavaScript 正則表達式,類似于用(yòng)其他(tā)編程語言(如 Perl)編寫的正則表達式。

DNA統計(jì) - 返回您輸入的序列中每個殘基的出現(xiàn)次數。 還給出了(le)每個殘基和(hé)某些(xiē)殘基組的百分比總數,使您可以快(kuài)速比較不同序列獲得的結果。

模糊搜索 DNA - 接受一個 DNA 序列和(hé)一個查詢序列,并返回與查詢相同或相似的位點。 例如,您可以使用(yòng)該程序來(lái)查找可以輕松突變爲有用(yòng)的限制性位點的序列。

模糊搜索蛋白(bái) - 接受一個蛋白(bái)質序列和(hé)一個查詢序列,并返回與查詢相同或相似的位點。

Ident 和(hé) Sim - 接受一組對(duì)齊的序列(FASTA 或 GDE 格式)并計(jì)算(suàn)每個序列對(duì)的同一性和(hé)相似性。 同一性和(hé)相似性值通常用(yòng)于評估兩個序列是否具有共同的祖先或功能(néng)。

變異摘要 - 接受 DNA 序列作(zuò)爲輸入,并搜索易于突變的區(qū)域以創建感興趣的限制性位點。 該程序還報(bào)告蛋白(bái)質翻譯,以便您可以查看(kàn)哪些(xiē)閱讀框被建議(yì)的突變改變。 使用(yòng) Mutate for Digest 查找可以使用(yòng) PCR 或定點誘變轉化爲有用(yòng)的限制性位點的序列。

多轉反 - 接受蛋白(bái)質比對(duì)并使用(yòng)密碼子使用(yòng)表生成簡并 DNA 編碼序列。 該程序還返回一個圖表,該圖表可用(yòng)于在核苷酸水(shuǐ)平上(shàng)找到(dào)最小(xiǎo)簡并區(qū)域。 在設計(jì) PCR 引物以與相關物種的未測序編碼序列退火時(shí)使用(yòng) Multi Rev Trans。

開(kāi)放(fàng)閱讀框查找器 - 在您輸入的 DNA 序列中搜索開(kāi)放(fàng)閱讀框 (ORF)。 該程序返回每個 ORF 的範圍,以及它的蛋白(bái)質翻譯。 ORF Finder 支持整個 IUPAC 字母表和(hé)幾個遺傳密碼。 使用(yòng) ORF Finder 搜索新測序的 DNA 以尋找潛在的蛋白(bái)質編碼片段。

成對(duì)對(duì)齊密碼子 - 接受兩個編碼序列并确定最佳全局比對(duì)。 使用(yòng) Pairwise Align Codons 尋找保守的編碼序列區(qū)域。

成對(duì)比對(duì) DNA - 接受兩個 DNA 序列并确定最佳全局比對(duì)。 使用(yòng) Pairwise Align DNA 尋找保守的序列區(qū)域。

成對(duì)比對(duì)蛋白(bái) - 接受兩個蛋白(bái)質序列并确定最佳全局比對(duì)。 使用(yòng) Pairwise Align Protein 尋找保守的序列區(qū)域。

PCR第一統計(jì) - 接受 PCR 引物序列列表并返回描述每個引物特性的報(bào)告,包括熔解溫度、GC 含量百分比和(hé) PCR 适用(yòng)性。 使用(yòng) PCR Primer Stats 評估潛在的 PCR 引物。

PCR産物 - 接受一個或多個 DNA 序列模闆和(hé)兩個引物序列。 該程序搜索可以産生 PCR 産物的完全匹配的引物退火位點。 任何産生的産物都按大(dà)小(xiǎo)排序,并給它們一個标題,說明(míng)它們的長度、它們在原始序列中的位置以及産生它們的引物。 您可以使用(yòng)線性或環狀分子作(zuò)爲模闆。 使用(yòng) PCR 産品确定您在實驗室中進行 PCR 時(shí)可以看(kàn)到(dào)的産品大(dà)小(xiǎo)。

蛋白(bái)質肉汁 - Protein GRAVY 返回您輸入的蛋白(bái)質序列的 GRAVY(親水(shuǐ)性的大(dà)平均值)值。 通過将每個殘基的親水(shuǐ)性值相加并除以序列長度來(lái)計(jì)算(suàn) GRAVY 值(Kyte 和(hé) Doolittle; 1982)。

蛋白(bái)質等電點 - 計(jì)算(suàn)您輸入的蛋白(bái)質序列的理(lǐ)論 pI(等電點)。 當您想知(zhī)道(dào)在 2-D 凝膠上(shàng)大(dà)約可以找到(dào)特定蛋白(bái)質的位置時(shí),請(qǐng)使用(yòng)蛋白(bái)質等電點。

蛋白(bái)質分子量 - 接受一個或多個蛋白(bái)質序列并計(jì)算(suàn)分子量。 您可以使用(yòng)提供的列表附加常用(yòng)表位和(hé)融合蛋白(bái)的副本。 如果您希望預測目标蛋白(bái)質在凝膠上(shàng)相對(duì)于一組蛋白(bái)質标準品的位置,請(qǐng)使用(yòng)蛋白(bái)質分子量。

蛋白(bái)質模式查找 - 接受一個或多個序列以及搜索模式,并返回與該模式匹配的站(zhàn)點的數量和(hé)位置。 搜索模式被編寫爲 JavaScript 正則表達式,類似于用(yòng)其他(tā)編程語言(如 Perl)編寫的正則表達式。

蛋白(bái)質統計(jì) - 返回您輸入的序列中每個殘基的出現(xiàn)次數。 還給出了(le)每個殘基和(hé)某些(xiē)殘基組的百分比總數,使您可以快(kuài)速比較不同序列獲得的結果。

限制文(wén)摘 - 用(yòng)一種、兩種或三種限制酶切割虛拟限制性消化中的 DNA 序列。 生成的片段按大(dà)小(xiǎo)排序,并給它們一個标題,說明(míng)它們的長度、它們在原始序列中的位置以及産生它們的酶位點。 您可以消化線性或環狀分子,甚至是分子混合物(通過以 FASTA 格式輸入多個序列)。 使用(yòng) Restriction Digest 确定您在實驗室執行摘要時(shí)将看(kàn)到(dào)的片段大(dà)小(xiǎo)。

限制摘要 - 接受 DNA 序列并返回常用(yòng)限制性内切酶切割位點的數量和(hé)位置。 如果您希望快(kuài)速确定酶是否切割特定的 DNA 片段,請(qǐng)使用(yòng)此程序。

反向翻譯 - 接受蛋白(bái)質序列作(zuò)爲輸入,并使用(yòng)密碼子使用(yòng)表生成代表最可能(néng)的非簡并編碼序列的 DNA 序列。 還返回源自(zì)每個氨基酸的所有可能(néng)密碼子的共有序列。 在設計(jì) PCR 引物以與相關物種的未測序編碼序列退火時(shí)使用(yòng)反向翻譯。

翻譯 - 接受 DNA 序列并将其轉換爲您指定的閱讀框中的蛋白(bái)質。 Translate 支持整個 IUPAC 字母表和(hé)幾個遺傳密碼。

 

序列圖:

顔色對(duì)齊保護 - 接受一組對(duì)齊的序列(FASTA 或 GDE 格式)并爲對(duì)齊着色。 該程序檢查每個殘基并将其與同一列中的其他(tā)殘基進行比較。 序列中相同的殘基被賦予黑色背景,序列中相似的殘基被賦予灰色背景。 剩餘的殘基得到(dào)白(bái)色背景。 您可以指定要應用(yòng)的着色必須相同和(hé)相似的殘基百分比。 使用(yòng) Color Align Conservation 增強序列比對(duì)程序的輸出。

顔色對(duì)齊屬性 - 接受一組對(duì)齊的序列(FASTA 或 GDE 格式)并爲對(duì)齊着色。 該程序檢查每個殘基并将其與同一列中的其他(tā)殘基進行比較。 序列中相同或相似的殘基被賦予彩色背景。 顔色是根據殘留物的生化特性來(lái)選擇的。 您可以指定要應用(yòng)的着色必須相同和(hé)相似的殘基百分比。 使用(yòng)顔色對(duì)齊特性突出顯示具有保守生化特性的蛋白(bái)質區(qū)域。

DNA組 - 調整 DNA 序列的間距并添加編号。 您可以指定組大(dà)小(xiǎo)(每組的堿基數)以及每行的堿基數。 這(zhè)個程序的輸出可以作(zuò)爲一個方便的參考,因爲編号和(hé)間距可以讓你(nǐ)快(kuài)速定位特定的堿基。

蛋白(bái)質組 - 調整蛋白(bái)質序列的間距并添加編号。 您可以指定組大(dà)小(xiǎo)(每組的殘基數)以及每行的殘基數。 這(zhè)個程序的輸出可以作(zuò)爲一個方便的參考,因爲編号和(hé)間距可以讓你(nǐ)快(kuài)速定位特定的殘基。

第一張地圖 - 接受 DNA 序列并返回顯示 PCR 引物退火位置的文(wén)本圖。 還可以顯示限制性内切酶切割位點和(hé) DNA 序列的蛋白(bái)質翻譯。 使用(yòng)該程序生成有用(yòng)的參考圖,特别是當您爲特定模闆設計(jì)了(le)大(dà)量引物時(shí)。 Primer Map 支持整個 IUPAC 字母表和(hé)幾個遺傳密碼。

限制地圖 - 接受 DNA 序列并返回顯示限制性内切酶切割位點位置的文(wén)本圖。 在您指定的閱讀框中,還給出了(le) DNA 序列的翻譯。 計(jì)劃克隆策略時(shí),請(qǐng)使用(yòng)該程序的輸出作(zuò)爲參考。 Restriction Map 支持整個 IUPAC 字母表和(hé)幾個遺傳密碼。

翻譯圖 - 接受 DNA 序列并返回顯示蛋白(bái)質翻譯的文(wén)本圖。 可以指定翻譯的閱讀框(1、2、3 或全部三個),也(yě)可以選擇将大(dà)寫文(wén)本作(zuò)爲閱讀框。 Translation Map 支持整個 IUPAC 字母表和(hé)幾個遺傳密碼。

随機序列:

突變 DNA - 将堿基變化引入 DNA 序列。 您可以選擇要引入的突變數量,以及是否保留序列中的第一個和(hé)最後三個堿基,以反映選擇作(zuò)用(yòng)以維持起始和(hé)終止密碼子。 每個突變的位置是随機選擇的,單個位點可以發生多個突變。 突變序列可用(yòng)于評估序列分析結果的重要性。

突變蛋白(bái)質 - 将殘基變化引入蛋白(bái)質序列。 您可以選擇要引入的突變數量,以及是否保留序列中的第一個殘基,以反映選擇作(zuò)用(yòng)以維持起始密碼子。 每個突變的位置是随機選擇的,單個位點可以發生多個突變。 突變序列可用(yòng)于評估序列分析結果的重要性。

随機編碼 DNA - 生成以起始密碼子開(kāi)始并以終止密碼子結束的随機開(kāi)放(fàng)閱讀框。 您可以選擇要使用(yòng)的遺傳密碼和(hé)要生成的序列長度。 随機序列可用(yòng)于評估序列分析結果的重要性。

随機 DNA 序列 - 生成您指定長度的随機序列。 随機序列可用(yòng)于評估序列分析結果的重要性。

随機 DNA 區(qū)域 - 用(yòng)随機堿基替換 DNA 序列區(qū)域。 随機序列可用(yòng)于評估序列分析結果的重要性。

随機蛋白(bái)質序列 - 生成您指定長度的随機序列。 随機序列可用(yòng)于評估序列分析結果的重要性。

随機蛋白(bái)質區(qū)域 - 用(yòng)随機殘基替換蛋白(bái)質序列區(qū)域。 随機序列可用(yòng)于評估序列分析結果的重要性。

樣本 DNA - 從(cóng)指導序列中随機選擇堿基,直到(dào)構建出您指定長度的序列。 每個選定的堿基都被替換,以便可以再次選擇它。

樣品蛋白(bái)質 - 從(cóng)指導序列中随機選擇堿基,直到(dào)構建出您指定長度的序列。 每個選定的殘基都會(huì)被替換,以便可以再次選擇它。

洗牌 DNA - 随機打亂 DNA 序列。 混洗序列可用(yòng)于評估序列分析結果的重要性,特别是當序列組成是重要考慮因素時(shí)。

洗牌蛋白(bái) - 随機打亂蛋白(bái)質序列。 混洗序列可用(yòng)于評估序列分析結果的重要性,特别是當序列組成是重要考慮因素時(shí)。