معلومة

كيف يتم حساب احتمال حدوث تسلسل مع بلاست؟

كيف يتم حساب احتمال حدوث تسلسل مع بلاست؟



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

ما هو احتمال حدوث تسلسل معين للنيوكليوتيدات / الأحماض الأمينية في عمليات بحث BLAST لبرنامج قاعدة البيانات بالكامل؟ كيف يتم حساب هذا الاحتمال؟


وفقًا لإحصائيات توثيق BLAST لمحاذاة التسلسل المحلي ، عند إجراء عمليات بحث في قاعدة البيانات ، يتم ذلك

من خلال التعامل مع قاعدة البيانات كتسلسل طويل واحد بطول N.

وبالتالي ، فإن N هو مجموع كل التسلسلات ذات الأحجام المختلفة من قاعدة بيانات معينة.

الافتراض الأساسي هو أن

الاستعلام هو بداهة من المرجح أن تكون مرتبطة بالتسلسل الطويل أكثر من التسلسل القصير ، لأن التسلسلات الطويلة غالبًا ما تتكون من عدة مجالات مختلفة.

لحساب الاحتمال ، نحتاج إلى اختيار نظام تسجيل النقاط (على سبيل المثال غير المعين: اختيار عقوبات عدم التطابق) ، والذي يمنحنا بالنسبة لتسلسل الاستعلام درجة دلالة إحصائية $ S $. العدد المتوقع من المحاذاة بدرجة لا تقل عن $ S $ يتبع توزيع قيم Gumbel القصوى:

$$ E = Kmn cdot e ^ {- lambda S} $$

أين م طول الاستعلام ، $ n = N $ و $ K $ و $ lambda $ معلمات توزيع.

مرة أخرى ، وفقًا للمستندات ومراجعها ، فإن احتمال العثور على تسلسل واحد على الأقل من هذا القبيل سيكون $ P = 1-e ^ {- E _ {(N)}} $ ، حيث $ E _ {(N)} $ هو رقم E لتسلسل N المتسلسلة وتسلسل الاستعلام.


الاحتمالية هي قياس احتمالية وقوع حدث ما. يتم قياسه كرقم بين 0 و 1 ، مع 1 يدل على اليقين ، و 0 يدل على أن الحدث لا يمكن أن يحدث. ويترتب على ذلك أنه كلما زادت احتمالية وقوع حدث ما ، زاد التأكد من وقوع الحدث. في الحالة الأكثر عمومية ، يمكن تعريف الاحتمال عدديًا على أنه عدد النتائج المرغوبة مقسومًا على العدد الإجمالي للنتائج. يتأثر هذا أيضًا بما إذا كانت الأحداث التي تتم دراستها مستقلة أو متنافية أو مشروطة ، من بين أشياء أخرى. تحسب الآلة الحاسبة المقدمة احتمال عدم وقوع الحدث A أو B ، والاحتمال A و / أو B يحدث عندما لا يكونا متعارضين ، واحتمال وقوع الحدثين A و B ، واحتمال وقوع الحدث A أو الحدث B يحدث B ، ولكن ليس كلاهما.

تكملة أ و ب

بالنظر إلى الاحتمالية أ، التي يرمز إليها ف (أ)، فمن السهل حساب المكمل ، أو الاحتمال الذي وصفه الحدث ف (أ) لا يحدث ، ف (أ '). إذا على سبيل المثال الفوسفور (أ) = 0.65 يمثل احتمال عدم قيام بوب بواجبه المنزلي ، ويمكن لمدرسه سالي التنبؤ باحتمالية قيام بوب بواجبه على النحو التالي:

بالنظر إلى هذا السيناريو ، هناك فرصة بنسبة 35٪ أن يقوم بوب بواجبه المنزلي. أي ف (ب ') سيتم حسابها بنفس الطريقة ، وتجدر الإشارة إلى أنه في الآلة الحاسبة أعلاه ، يمكن أن تكون مستقلة ، أي إذا الفوسفور (أ) = 0.65 ، الفوسفور (ب) ليس بالضرورة أن يساوي 0.35ويمكن أن يساوي 0.30 أو أي رقم آخر.

تقاطع أ و ب

تقاطع الأحداث أ و ب، مكتوب كـ ف (أ & # س 2229 ب) أو ف (أ و ب) هو الاحتمال المشترك لحدثين على الأقل ، كما هو موضح أدناه في مخطط Venn. في حالة أين أ و ب هي أحداث متنافية ، ف (أ & # س 2229 ب) = 0. ضع في اعتبارك احتمال دحرجة 4 و 6 على لفة واحدة من النرد ، فهذا غير ممكن. لذلك تعتبر هذه الأحداث متعارضة. الحوسبة ف (أ & # س 2229 ب) بسيط إذا كانت الأحداث مستقلة. في هذه الحالة ، احتمالات الحدث أ و ب تتضاعف. لإيجاد احتمال أن ينتج عن لفتين منفصلتين من النرد 6 في كل مرة:

تأخذ الحاسبة المقدمة في الاعتبار الحالة التي تكون فيها الاحتمالات مستقلة. يكون حساب الاحتمال أكثر انخراطًا قليلاً عندما تكون الأحداث تابعة ، وينطوي على فهم الاحتمال الشرطي ، أو احتمالية وقوع الحدث أ بالنظر إلى هذا الحدث ب قد حدث، ف (أ | ب). خذ على سبيل المثال كيسًا من 10 كرات ، 7 منها سوداء و 3 زرقاء. احسب احتمالية سحب الرخام الأسود إذا تم سحب الرخام الأزرق بدون استبدال (تتم إزالة الرخام الأزرق من الكيس ، مما يقلل العدد الإجمالي للرخام في الكيس):

احتمالية رسم رخام أزرق:

احتمالية رسم رخام أسود:

احتمال رسم رخام أسود بالنظر إلى رسم رخام أزرق:

كما يمكن أن نرى ، فإن احتمال رسم الرخام الأسود يتأثر بأي حدث سابق حيث تم رسم رخام أسود أو أزرق بدون استبدال. وبالتالي ، إذا أراد شخص ما تحديد احتمالية سحب الرخام الأزرق ثم الأسود من الكيس:

احتمالية رسم رخام أزرق ثم أسود باستخدام الاحتمالات المحسوبة أعلاه:

اتحاد أ و ب

في الاحتمال ، اتحاد الأحداث ، P (A U B)، بشكل أساسي الحالة التي يحدث فيها أي من الأحداث قيد النظر أو جميعها ، كما هو موضح في مخطط Venn أدناه. لاحظ أن P (A U B) يمكن أيضًا كتابتها كـ ف (أ أو ب). في هذه الحالة ، يتم استخدام "شامل OR". هذا يعني أنه على الرغم من أن شرطًا واحدًا على الأقل داخل الاتحاد يجب أن يكون صحيحًا ، يمكن أن تكون جميع الشروط صحيحة في نفس الوقت. هناك حالتان لاتحاد الأحداث ، إما أن تكون الأحداث متنافية ، أو أن الأحداث ليست حصرية بشكل متبادل. في الحالة التي تكون فيها الأحداث متنافية ، يكون حساب الاحتمال أبسط:

المثال الأساسي للأحداث المتنافية هو رمي النرد حيث الحدث أ هو احتمال ظهور رقم زوجي ، والحدث ب هو احتمال ظهور رقم فردي. من الواضح في هذه الحالة أن الأحداث متنافية لأن الرقم لا يمكن أن يكون زوجيًا وفرديًا ، لذلك P (A U B) سيكون 3/6 + 3/6 = 1، لأن النرد القياسي يحتوي فقط على أرقام فردية وزوجية.

الآلة الحاسبة أعلاه تحسب الحالة الأخرى ، حيث الأحداث أ و ب لا يستبعد أحدهما الآخر. في هذه الحالة:

باستخدام مثال دحرجة حجر النرد مرة أخرى ، ابحث عن احتمال ظهور رقم زوجي أو رقم مضاعف لـ 3. هنا يتم تمثيل المجموعة من خلال 6 قيم للنرد ، مكتوبة على النحو التالي:

S =
احتمال رقم زوجي:الفوسفور (أ) = <2،4،6> = 3/6
احتمال مضاعف 3:الفوسفور (ب) = <3،6> = 2/6
تقاطع أ و ب: الفوسفور (A & # x2229 B) = <6> = 1/6
الفوسفور (A U B) = 3/6 + 2/6 -1/6 = 2/3

OR حصريًا لـ A و B

السيناريو المحتمل الآخر الذي تحسبه الآلة الحاسبة أعلاه هو P (A XOR B)، الموضح في مخطط Venn أدناه. يتم تعريف عملية "OR الحصري" على أنها الحدث الذي يقع فيه A أو B ، ولكن ليس في وقت واحد. المعادلة كالتالي:

على سبيل المثال ، تخيل أنه عيد الهالوين ، وقد تم وضع دلاء من الحلوى خارج المنزل ، أحدهما يحتوي على Snickers والآخر يحتوي على Reese. يتم وضع العديد من إشارات النيون الوامضة حول دلاء الحلوى مصرة على أن كل خدعة أو معالجة لا تأخذ سوى سنيكرز أو ريس واحدًا ولكن ليس كليهما! ومع ذلك ، فمن غير المحتمل أن يلتزم كل طفل بإشارات النيون الوامضة. بالنظر إلى احتمال اختيار ريس كـ الفوسفور (أ) = 0.65، أو اختيار Snickers مع الفوسفور (ب) = 0.349، وأ P (غير مرجح) = 0.001 أن الطفل يمارس ضبط النفس أثناء التفكير في أضرار تجويف مستقبلي محتمل ، احسب احتمال اختيار سنيكرز أو ريس ، ولكن ليس كلاهما:

0.65 + 0.349 - 2 × 0.65 × 0.349 = 0.999 - 0.4537 = 0.5453

لذلك ، هناك احتمال بنسبة 54.53٪ أن يتم اختيار سنيكرز أو ريس ، ولكن ليس كلاهما.


كيفية الجمع بين احتمال حدثين

احتمال وقوع حدث هو فرصة وقوع الحدث في موقف معين. إن احتمال الحصول على "ذيول" على رمية واحدة لعملة ، على سبيل المثال ، هو 50 في المائة ، على الرغم من أن قيمة الاحتمال هذه في الإحصائيات تكتب عادة في شكل عشري كـ 0.50. يمكن دمج قيم الاحتمالات الفردية لأحداث متعددة لتحديد احتمال حدوث تسلسل معين للأحداث. للقيام بذلك ، ومع ذلك ، يجب أن تعرف ما إذا كانت الأحداث مستقلة أم لا.

أولاً ، شاهد الفيديو أدناه للحصول على معلومات سريعة حول الاحتمالات الأساسية:

  1. حدد الاحتمال الفردي (P) لكل حدث سيتم دمجه. احسب النسبة م / م حيث م هو عدد النتائج التي تنتج في حالة الاهتمام و م هي جميع النتائج المحتملة. على سبيل المثال ، يمكن حساب احتمال دحرجة ستة على لفة واحدة باستخدام m = 1 (نظرًا لأن وجهًا واحدًا فقط يعطي نتيجة ستة) و M = 6 (نظرًا لوجود ستة وجوه محتملة يمكن أن تظهر) لـ P = 1/6 أو 0.167.
  2. حدد ما إذا كان الحدثان الفرديان مستقلان أم لا. لا تتأثر الأحداث المستقلة ببعضها البعض. على سبيل المثال ، لا يتأثر احتمال ظهور وجه على عملة معدنية بنتائج رمي سابق لنفس العملة ، وبالتالي فهو مستقل.
  3. حدد ما إذا كانت الأحداث مستقلة. إذا لم يكن كذلك ، فاضبط احتمالية الحدث الثاني ليعكس الشروط المحددة للحدث الأول. على سبيل المثال ، إذا كان هناك ثلاثة أزرار - واحد أخضر ، وآخر أصفر ، وآخر أحمر - فقد ترغب في العثور على احتمال اختيار الزر الأحمر ثم الزر الأخضر. P لاختيار الزر الأول الأحمر هو 1/3 ولكن P لاختيار الزر الثاني الأخضر هو 1/2 نظرًا لأن أحد الأزرار قد اختفى الآن.
  4. اضرب الاحتمالات الفردية للحدثين معًا للحصول على الاحتمال المشترك. في مثال الزر ، يكون الاحتمال المشترك لاختيار الزر الأحمر أولاً والثاني الأخضر هو P = (1/3) (1/2) = 1/6 أو 0.167.

نصيحة: يمكن استخدام هذا النهج نفسه لإيجاد احتمال أكثر من حدثين.


كيف تحسب الاحتمالية

شارك Mario Banuelos، Ph.D في تأليف المقال. ماريو بانويلوس أستاذ مساعد في الرياضيات بجامعة ولاية كاليفورنيا ، فريسنو. مع أكثر من ثماني سنوات من الخبرة في التدريس ، يتخصص ماريو في علم الأحياء الرياضي ، والتحسين ، والنماذج الإحصائية لتطور الجينوم ، وعلوم البيانات. ماريو حاصل على بكالوريوس في الرياضيات من جامعة ولاية كاليفورنيا ، فريسنو ، ودكتوراه. في الرياضيات التطبيقية من جامعة كاليفورنيا ، ميرسيد. قام ماريو بالتدريس في كل من المدرسة الثانوية والمستوى الجامعي.

هناك 15 مرجعًا تم الاستشهاد بها في هذه المقالة ، والتي يمكن العثور عليها في أسفل الصفحة.

يضع موقع wikiHow علامة على المقالة كموافقة القارئ بمجرد تلقيها ردود فعل إيجابية كافية. في هذه الحالة ، كتب العديد من القراء ليخبرونا أن هذه المقالة كانت مفيدة لهم ، مما أكسبها حالة موافقة القارئ.

تمت مشاهدة هذا المقال 2،814،300 مرة.

عندما تحسب الاحتمال ، فأنت تحاول معرفة احتمالية وقوع حدث معين ، بالنظر إلى عدد معين من المحاولات. [1] مصدر بحث X الاحتمال هو احتمال وقوع حدث معين ويمكننا إيجاد احتمال وقوع حدث باستخدام النسبة عدد النتائج الإيجابية / إجمالي عدد النتائج. إن حساب احتمال وقوع أحداث متعددة هو مسألة تقسيم المشكلة إلى احتمالات منفصلة وضرب الاحتمالات المنفصلة في بعضها البعض.


احتمالات أكثر تعقيدًا

أنت تعرف كيف يقولون أن المال يمكن أن يشتري لك السعادة؟ حسنًا ، إنه & aposs صحيح ذلك هناك أوقات لا تكفي فيها العملة المعدنية إذا كنت تريد حساب احتمالية حدوث شيء ما. إذا كانت مشكلتك لا تزال تندرج تحت مظلة الاحتمال الكلاسيكي - مما يعني أنه يمكنك تحديد عدد النتائج الناجحة الموجودة وعدد الاحتمالات بشكل عام - فإن صيغة احتمالية قلب العملة من القسم الأول ستعمل بشكل جيد. إذا كنت تبحث عن فرصك في الفوز باليانصيب أو البقاء على قيد الحياة في جزيرة صحراوية ، فستبدأ الأمور في التعقيد أكثر من مجرد احتمال رمي عملة معدنية. تحقق من قسم الإحصائيات الخاص بنا لمساعدتك في رحلتك في البحث عن الاحتمالية الأكثر احتمالية!


كيف يتم حساب احتمال حدوث تسلسل مع بلاست؟ - مادة الاحياء

سلة مشترياتك فارغة حاليا. i & ltp> عند تصفح بروتينات UniProt المختلفة ، يمكنك استخدام "السلة" لحفظها ، بحيث يمكنك العودة للعثور عليها أو تحليلها لاحقًا. & ltp> & lta href = '/ help / basket' target = '_ top'> أكثر. & lt / a> & lt / p>

حدد عنصرًا (عناصر) وانقر فوق "إضافة إلى السلة" لإنشاء مجموعتك الخاصة هنا
(بحد أقصى 400 إدخال)

عمليات البحث عن تشابه التسلسل

آخر تعديل في 30 أبريل 2021

حدد ملف انفجار علامة تبويب شريط الأدوات لتشغيل بحث عن تشابه التسلسل باستخدام برنامج BLAST (أداة البحث المحلية الأساسية):

  1. أدخل إما تسلسل بروتين أو نيوكليوتيد (تسلسل خام أو تنسيق فاستا) أو معرف UniProt في حقل النموذج.
  2. انقر على انفجار زر.

يتم دعم الأنواع التالية من معرفات UniProt:

P00750دخول UniProtKB
P00750-2تسلسل الشكل الإسوي لدخول UniProtKB
P00750 [1-20]جزء من تسلسل دخول UniProtKB ، من بقايا الأحماض الأمينية الأولى إلى العشرين (شاملة)
A4_HUMANاسم إدخال UniProtKB
UPI0000000001دخول UniParc
UniRef100_P00750دخول UniRef

إذا قمت بتحديد ملف انفجار من شريط الأدوات من صفحة إدخال UniProtKB أو UniRef أو UniParc ، يتم ملء التسلسل الحالي مسبقًا في النموذج.


قاعدة الضرب للأحداث المستقلة (القاعدة السادسة)

ننتقل الآن إلى قواعد الحساب

تبدأ بقاعدة الضرب للأحداث المستقلة.

باستخدام مخطط Venn ، يمكننا تصور & # 8220A و B ، & # 8221 الذي يمثله التداخل بين الأحداث A و B:

قاعدة الاحتمالية السادسة (قاعدة الضرب للأحداث المستقلة):

  • عند التعامل مع الاحتمالات قواعد، الكلمة & # 8220 و # 8221 سترتبط دائمًا بتشغيل عمليه الضرب ومن هنا جاء اسم هذه القاعدة & # 8220 قاعدة الضرب. & # 8221

الأحداث الحصرية وغير الحصرية بشكل متبادل

احداث حصرية متبادلة هي أحداث لا يمكن أن تحدث معًا. على سبيل المثال ، في رمي النرد ، 5 و 6 يمكن أن يحدثوا معًا. مثال آخر هو اختيار الحلوى الملونة من البرطمان. إذا كان حدث ما يختار حلاوة حمراء ، وكان حدث آخر هو اختيار حلوى زرقاء ، وإذا تم اختيار حلوى زرقاء ، فيمكن أن يكون أيضًا حلو أحمر والعكس صحيح.

حدث متبادل غير حصريهي أحداث يمكن أن تحدث معًا. على سبيل المثال ، عندما يتم سحب بطاقة من حزمة ويكون الحدث عبارة عن بطاقة سوداء أو بطاقة آس. إذا تم رسم أسود ، فإن هذا لا يستبعده من كونه الآس. وبالمثل ، إذا تم رسم الآس ، فإن هذا لا يستبعده من كونه بطاقة سوداء.


أهمية بروتين Myc و Max و Mad

تعد شبكة النسخ Myc-Max-Mad لبروتينات bHLH ضرورية للتحكم في نمو الخلايا وتكاثرها وتمايزها وموت الخلايا المبرمج (2-6). مايك هو أحد مكونات الأورام الراسخة التي يكون تعبيرها غير المنظم مسؤولاً عن مجموعة واسعة من السرطانات التي تصيب الإنسان. ما يقرب من 70،000 حالة وفاة بالسرطان في الولايات المتحدة كل عام تنشأ من سوء التنظيم مايك. تعد تفاعلات البروتين والبروتين مع Max عنصرًا أساسيًا في الأداء السليم لشبكة عامل النسخ Myc-Max-Mad. يقوم Mad-Max heterodimers بقمع تعبير مايك والشروع في التمايز. على الرغم من قدرتها على تجانس ضعيف ، إلا أن وظيفة Myc المناسبة تتطلب التغاير مع Max (7). حاولت جهود مكثفة لعزل هذه البروتينات المسرطنة في مجموعة متنوعة من الكائنات الحية باستخدام الأساليب الجزيئية والحاسوبية. في الواقع ، كان تطوير الحافز التنبئي لبروتينات bHLH (1) ناجحًا جدًا عند تطبيقه على مجموعات متنوعة مثل Ascidians ، ذبابة الفاكهةوالديدان والنباتات (8-12).

تعكس ستة أنواع على الأقل من بروتين Myc سلالات تطورية منفصلة (WRA ، بيانات غير منشورة). الأكثر دراسة على نطاق واسع هو c-Myc ، المتماثل الخلوي للبروتين الورمي الفيروسي (v-Myc) للفيروس القهقري للورم النخاعي للطيور (13). بالإضافة إلى ذلك ، تشتمل عائلة Myc على L-Myc و N-Myc و S-Myc و B-Myc ، والتي يتم التعبير عنها بطريقة خاصة بالأنسجة (5). يرتبط L-Myc بسرطان الرئة ، بينما يرتبط N-Myc بالورم الأرومي العصبي (13). يُظهر B- و S-Myc تباعدًا وظيفيًا وتباعدًا أكبر بكثير من c- و L- و N-Myc. يعتبر B-Myc متماثلًا مع مجال معاملات N-terminal ولكنه يفتقر إلى مجال bHLH dimerization. نحن نعتبر Myc من البروتستومات (ذبابة الفاكهة و أنوفيليس) ككليد منفصل عن سلالة الديوتروستوم بسبب سمات التسلسل المتباينة لكل مجموعة (14).


قائمة المصطلحات

تحتوي قائمة المصطلحات التالية على بعض التعريفات المستعارة من المسرد في NCBI ، والبعض الآخر أصلي ، وقد تم استخراج القليل من الكتب ، كما هو موضح بشكل فردي. تم استعارة الصور ، عندما لا تكون أصلية ، من جامعة واشنطن على الرابط: http://www.cs.washington.edu/education/courses/590bi/98wi.

الفهرس السريع: A-B ، C-D ، E-F ، G-H ، I-J ، K-L ، M-N ، O-P ، Q-R ، S-T ، U-Z.
عدد الانضمام رمز فريد يحدد تسلسل في قاعدة بيانات. بالنسبة للمستخدمين الأكثر تقدمًا ، فإن رقم الدخول الأساسي هو المفتاح الأساسي للجدول في قاعدة البيانات العلائقية genbank. أرقام الدخول الثانوية هي رموز أخرى تحدد أيضًا التسلسل ولكنها لم تعد تُستخدم كرموز أولية. قد يحتوي رقم الإدخال على رقم إصدار مرفق في النهاية إذا تم تحديث التسلسل (أي إذا تمت إضافة المزيد من التسلسل إليه أو تصحيحه). رقم الدخول ينقل المستخدم إلى التسلسل في أحدث شكل له (الإصدار الأخير). هذا يختلف عن أرقام gi.
انتقام عملية اصطفاف متسلسلين أو أكثر لتحقيق أقصى مستويات الهوية (والحفظ ، في حالة متواليات الأحماض الأمينية) لغرض تقييم درجة التشابه وإمكانية التماثل. شاهد هذا المثال البسيط لمحاذاة الحروف:

الخوارزمية إجراء ثابت يتجسد في برنامج حاسوبي. من كتاب Gusfield: "وصف عالي المستوى لطريقة آلية لحل مشكلة أو حساب دالة."
ASN.1 في سياق NCBI ، ASN.1 هو تمثيل لجميع المعلومات التي تحتوي على تسلسل بيولوجي (تسلسل جزيء بروتين DNA-RNA ، جنبًا إلى جنب مع جميع البيانات الأخرى مثل المؤلفين والتاريخ والشرح ، إلخ) ، ولكن يتعارض مع تنسيق GENBANK ، ASN1 مناسب للتحليل بواسطة الآلات (معالجة البيانات) وأقل ملاءمة للقراءة البشرية. ASN1 هو معيار لنقل المعلومات ، ولا يقتصر على المعلومات البيولوجية ، في الواقع ، لطالما استخدم هذا المعيار من قبل صناعة الاتصالات.
المعلوماتية الحيوية دمج التكنولوجيا الحيوية وتكنولوجيا المعلومات بهدف الكشف عن رؤى ومبادئ جديدة في علم الأحياء.
انفجار باسيك إلocal أlignment سالبحث تيأول. (Altschul et al.) خوارزمية مقارنة تسلسلية محسّنة للسرعة المستخدمة في البحث في قواعد بيانات التسلسل للحصول على محاذاة محلية مثالية للاستعلام. يتم إجراء البحث الأولي عن كلمة طولها "W" تسجل على الأقل "T" عند مقارنتها بالاستعلام باستخدام مصفوفة الاستبدال. يتم بعد ذلك توسيع مرات تسجيل الكلمات في أي من الاتجاهين في محاولة لإنشاء محاذاة بدرجة تتجاوز عتبة "S". تحدد المعلمة "T" سرعة البحث وحساسيته. للحصول على تفاصيل إضافية ، راجع أحد دروس بلاست التعليمية.
النتيجة بت تُشتق القيمة S 'من درجة المحاذاة الخام S التي تم فيها مراعاة الخصائص الإحصائية لنظام التسجيل المستخدم. نظرًا لأنه تم تطبيع درجات البت فيما يتعلق بنظام التسجيل ، يمكن استخدامها لمقارنة درجات المحاذاة من عمليات بحث مختلفة.
زهرة بلوسيكس سوbstitution مأتريكس. مصفوفة إحلال يتم من خلالها اشتقاق الدرجات الخاصة بكل مركز الملاحظات ترددات الاستبدالات في كتل المحاذاة المحلية في البروتينات ذات الصلة. كل مصفوفة مصممة لمسافة تطورية معينة. في مصفوفة BLOSUM62 ، على سبيل المثال ، تم إنشاء المحاذاة التي تم اشتقاق الدرجات منها باستخدام تسلسلات لا تشترك في هوية أكثر من 62٪. يتم تمثيل التسلسلات الأكثر تشابهًا من 62٪ من خلال تسلسل واحد في المحاذاة لتجنب الإفراط في ترجيح أفراد الأسرة المرتبطين ارتباطًا وثيقًا. (هنيكوف وهنيكوف)
عميل
جهاز كمبيوتر أو برنامج يعمل على جهاز كمبيوتر يتفاعل مع كمبيوتر آخر في موقع بعيد (خادم). هذا المفهوم يختلف عن "المستخدم".
الحفاظ على التغييرات في موضع معين من حمض أميني أو تسلسل (أقل شيوعًا ، DNA) يحافظ على الخصائص الفيزيائية والكيميائية للمخلفات الأصلية.
البرمجة الديناميكية البرمجة الديناميكية هي تقنية تحسين عامة جدًا يمكن تطبيقها على المشكلات التي يمكن تقسيمها إلى مشكلات فرعية مماثلة ذات حجم أصغر بحيث يمكن الحصول على حل المشكلة الأكبر من خلال الجمع بين الحلول للمشكلات الفرعية. تُستخدم أساليب "فرق تسد" هذه كثيرًا لحل مشاكل المحاذاة.

من http://www.mpri.lsu.edu/Chapter7.htm: "تحول البرمجة الديناميكية مشكلة تحسين كبيرة ومعقدة إلى سلسلة من المشكلات الأصغر المترابطة ، كل منها يحتوي على متغيرات قليلة فقط. والنتيجة هي سلسلة من التحسينات الجزئية تتطلب جهدًا مخفضًا للعثور على الأمثل ".
اختصاص جزء منفصل من البروتين يفترض أنه ينثني بشكل مستقل عن باقي البروتين وله وظيفته الخاصة.
تراب برنامج لتصفية المناطق منخفضة التعقيد من تسلسل الحمض النووي.
قيمة E قيمة التوقع. عدد المحاذاة المختلفة ذات الدرجات المكافئة لـ S أو أفضل منها والتي يُتوقع حدوثها في البحث في قاعدة البيانات عن طريق الصدفة. كلما انخفضت قيمة E ، زادت أهمية النتيجة.
est يرمز إلى "Expressed Sequence Tag" ، وهو تسلسل من أحد النهايات (إما من 5 'من 3' نهاية) لاستنساخ تعبير ، مثل cDNA clone من مكتبة تعبير (لقطة من mRNAs من نسيج عند معين الوقت في التنمية).
بحكم طبيعة التكنولوجيا الحالية ، نادرًا ما يمتد تسلسل EST إلى تسلسل الإدراج الكامل. الاتجاه الآن هو التسلسل من طرفي الاستنساخ (وعندما يكون ذلك ممكنًا ، للحصول على تسلسل الإدخال بالكامل).
توفر ESTs أيضًا موضع علامة في خريطة الجينوم (عند تعيينها عن طريق تعيين تردد إعادة التركيب) وفي خريطة مادية (عند تعيينها بواسطة مقياس PCR من أو التهجين إلى مجموعة من النسخ الكبيرة المطلوبة) بطريقة مماثلة لعلامات STS مع ميزة أن ESTs هي رابط مباشر للجينات المعبر عنها.
يتم تخزين تسلسلات EST العامة في قاعدة بيانات dbEST في Genbank.
فاستا أول خوارزمية مستخدمة على نطاق واسع للبحث عن تشابه قواعد البيانات. يبحث البرنامج عن المحاذاة المحلية المثلى عن طريق مسح تسلسل التطابقات الصغيرة التي تسمى "الكلمات". مبدئيًا ، يتم حساب درجات المقاطع التي توجد بها نتائج متعددة للكلمات ("init1"). في وقت لاحق ، يمكن تلخيص درجات عدة مقاطع لتوليد درجة "initn". يتم عرض المحاذاة المحسنة التي تتضمن فجوات في الإخراج على أنها "اختيار". ترتبط حساسية وسرعة البحث بشكل عكسي ويتحكم فيهما متغير "k-tup" الذي يحدد حجم "الكلمة". (بيرسون وليبمان)
الفلتره يُعرف أيضًا باسم الإخفاء. عملية إخفاء مناطق تسلسل (الحمض النووي أو الأحماض الأمينية) لها خصائص تؤدي في كثير من الأحيان إلى درجات عالية زائفة. انظر SEG و DUST.
الفارق مساحة يتم إدخالها في المحاذاة للتعويض عن عمليات الإدراج والحذف في تسلسل واحد بالنسبة إلى الآخر. لمنع تراكم الكثير من الفجوات في المحاذاة ، يؤدي إدخال فجوة إلى خصم مبلغ ثابت (درجة الفجوة) من درجة المحاذاة. توسيع الفجوة لتشمل النيوكليوتيدات الإضافية أو الأحماض الأمينية يعاقب أيضًا في تسجيل المحاذاة.
رقم GI رقم gi ، مثل رقم التعريف ، هو معرفات فريدة لتسلسل معين. يأخذ رقم gi المستخدم إلى التسلسل في حالته عندما تم إدخاله أو تعديله. في كل مرة يتم فيها تحديث تسلسل ، فإنه يحتفظ برقم الانضمام الخاص به (مع إرفاق رقم إصدار جديد) ولكنه يتلقى ملف الجديد gi-number الذي يمثل حالته الجديدة. تحتوي بعض التسلسلات التي تم تحديثها على "سجل" أكثر من رقم gi واحد ، ويمكن استرجاع حالاتها المختلفة من التسلسل.
المحاذاة العالمية محاذاة تسلسلين من الحمض النووي أو البروتين على طولهما بالكامل.
ح H هي الانتروبيا النسبية للهدف وترددات المخلفات الخلفية. (كارلين والتشول ، 1990). يمكن اعتبار H كمقياس لمتوسط ​​المعلومات (بالبتات) المتاحة لكل موضع والتي تميز المحاذاة عن الصدفة. في القيم العالية لـ H ، يمكن تمييز المحاذاة القصيرة بالصدفة ، بينما عند قيم H المنخفضة ، قد تكون المحاذاة الأطول ضرورية. (ألتشول ، 1991)
ارشادي الاستدلال في تعريف مبسط للغاية ، هو الإجراء الذي يشتق التقريب للإجابة الحقيقية لمشكلة بطريقة أكثر اقتصادا أو أسرع من استخدام خوارزمية أكثر "صرامة" رياضيا. ومع ذلك ، فإن الحصول على إجابة "صواب" ليس مضمونًا بنسبة 100٪.
في علوم الكمبيوتر ، يتم تطبيق الاستدلال عندما يكون إيجاد الحل الدقيق لمشكلة ما عبر خوارزميات صارمة أمرًا غير عملي من الناحية الحسابية.
تنادد يُعزى التشابه إلى النسب من سلف مشترك. قارن هذا بـ "homoplasy". من تعريف آخر في مكان آخر (Virginia Tech، Dept. of Biochem): يجب على المرء أن يدرك أن التنادد لا يعني بالضرورة التشابه. التنادد له تعريف دقيق: وجود أصل تطوري مشترك. وبالتالي ، فإن التنادد هو وصف نوعي لطبيعة العلاقة بين شيئين أو أكثر ، ولا يمكن أن يكون جزئيًا. إما أن تكون هناك علاقة تطورية أو لا توجد. يجب أن يظل تأكيد التماثل عادةً فرضية. قد تتضمن البيانات الداعمة لعلاقة متجانسة تسلسلًا أو تشابهًا ثلاثي الأبعاد ، يمكن وصف العلاقات بينهما بمصطلحات كمية. ملاحظة ذات أهمية في نمذجة التماثل هي أنه بالنسبة لمجموعة من البروتينات التي يُفترض أنها متماثلة ، يتم الحفاظ على هياكلها ثلاثية الأبعاد إلى حد أكبر من هياكلها الأولية. تم استخدام هذه الملاحظة لتوليد نماذج من البروتينات من متماثلات ذات تشابهات منخفضة للغاية في التسلسل. وهكذا ، في نمذجة التماثل ، نحاول تطوير نماذج غير معروفة من البروتينات المتماثلة. سيكون لهذه البروتينات قدر من التشابه في التسلسل ، لكننا نعتمد على الحفاظ على الطيات بين المتماثلات لإرشادنا أيضًا.
Homoplasy التشابه الذي تطور بشكل مستقل ولا يشير إلى أصل مشترك.
HSP زوج قطعة عالية الدرجات. المحاذاة المحلية مع عدم وجود فجوات تحقق واحدة من أعلى درجات المحاذاة في بحث معين.
هوية مدى ثبات تسلسلين (نيوكليوتيدات أو أحماض أمينية).
ك معلمة إحصائية تُستخدم في حساب درجات بلاست التي يمكن اعتبارها مقياسًا طبيعيًا لحجم مساحة البحث. يتم استخدام القيمة K في تحويل الدرجة الأولية (S) إلى درجة بت (S ').
لامدا معلمة إحصائية تُستخدم في حساب درجات بلاست والتي يمكن اعتبارها مقياسًا طبيعيًا لنظام التسجيل. تُستخدم قيمة لامدا في تحويل الدرجة الأولية (S) إلى درجة بت (S ').
المحاذاة المحلية محاذاة جزء من تسلسل الحمض النووي أو البروتين
منطقة منخفضة التعقيد (LCR) مناطق التكوين المتحيز بما في ذلك عمليات التشغيل المتجانسة ، والتكرار لفترة قصيرة ، والتمثيل المفرط الأكثر دقة لواحد أو عدد قليل من البقايا. يستخدم برنامج SEG لإخفاء أو تصفية LCRs في استعلامات الأحماض الأمينية. يستخدم برنامج DUST لإخفاء أو تصفية LCRs في استعلامات الحمض النووي.
قناع يُعرف أيضًا باسم التصفية. إزالة مناطق التعقيد المتكررة أو المنخفضة من تسلسل من أجل تحسين حساسية عمليات البحث عن تشابه التسلسل التي يتم إجراؤها بهذا التسلسل.
عنصر منطقة محفوظة قصيرة في تسلسل البروتين. غالبًا ما تكون الزخارف أجزاء محفوظة بشكل كبير من مجالات البروتين.
محاذاة تسلسل متعدد محاذاة من ثلاثة متواليات أو أكثر مع وجود فجوات مدرجة في التسلسلات بحيث تتم محاذاة البقايا ذات المواضع الهيكلية المشتركة و / أو مخلفات الأسلاف في نفس العمود. يعد Clustal W أحد أكثر برامج محاذاة التسلسل المتعددة استخدامًا. انظر إلى المثال البسيط الذي يحتوي على ثلاث سلاسل من الأحرف


المحاذاة المثلى محاذاة تسلسلين أو أكثر بأعلى درجة ممكنة.
متعامد قد تكون التسلسلات المتشابهة في الأنواع المختلفة التي نشأت من جين سلف مشترك أثناء الانتواع مسئولة أو لا تكون مسئولة عن وظيفة مماثلة. تذكر: فصل التسلسلين بسبب حدث SPECIATION.
قيمة P. احتمال حدوث محاذاة مع الدرجة المعنية أو أفضل منها. يتم حساب القيمة p من خلال ربط درجة المحاذاة الملحوظة ، S ، بالتوزيع المتوقع لدرجات HSP من مقارنات التسلسلات العشوائية بنفس الطول والتكوين مثل الاستعلام بقاعدة البيانات. ستكون قيم P الأكثر أهمية هي تلك القريبة من 0. قيم P و E هي طرق مختلفة لتمثيل أهمية المحاذاة.
بام النسبة المئوية للطفرة المقبولة. وحدة قدمها دايهوف وآخرون. لتحديد مقدار التغيير التطوري في تسلسل البروتين. 1.0 وحدة PAM ، هي مقدار التطور الذي سيتغير ، في المتوسط ​​، بنسبة 1 ٪ من الأحماض الأمينية في تسلسل البروتين. مصفوفة الاستبدال PAM (x) عبارة عن جدول بحث تم فيه حساب الدرجات لكل استبدال للأحماض الأمينية بناءً على تكرار هذا الاستبدال في البروتينات وثيقة الصلة التي شهدت قدرًا معينًا (x) من الاختلاف التطوري.
Paralogous تسلسلات متماثلة داخل نوع واحد نشأت عن طريق الازدواج الجيني.
الملف الشخصي جدول يسرد ترددات كل حمض أميني في كل موضع من تسلسل البروتين. يتم حساب الترددات من محاذاة متعددة من التسلسلات التي تحتوي على مجال الاهتمام. انظر أيضا PSSM.

البروتيوميات تحليل منهجي للتعبير البروتيني للأنسجة الطبيعية والمريضة والذي يتضمن فصل وتحديد وتوصيف جميع البروتينات في الكائن الحي.
PSI-BLAST صموقف-سخاص أناالانفجار التراثي. بحث تكراري باستخدام خوارزمية بلاست. يتم إنشاء ملف تعريف بعد البحث الأولي ، والذي يتم استخدامه بعد ذلك في عمليات البحث اللاحقة. يمكن تكرار العملية ، إذا رغبت في ذلك مع تسلسلات جديدة موجودة في كل دورة تستخدم لتحسين المظهر الجانبي. يمكن العثور على التفاصيل في هذه المناقشة حول PSI-BLAST. (ألتشول وآخرون)
PSSM مصفوفة التسجيل الخاصة بالموقف انظر الملف الشخصي. يعطي PSSM درجة احتمالات السجل للعثور على حمض أميني مطابق معين في تسلسل مستهدف.
استفسار تسلسل الإدخال (أو أي نوع آخر من مصطلح البحث) الذي سيتم مقارنة جميع الإدخالات في قاعدة البيانات به.
صافى المجموع درجة المحاذاة ، S ، محسوبة كمجموع درجات الاستبدال والفجوة. يتم إعطاء درجات الاستبدال من خلال جدول بحث (انظر PAM ، BLOSUM). يتم احتساب درجات الثغرة عادةً على أنها مجموع G ، عقوبة فتح الفجوة و L ، عقوبة تمديد الفجوة. بالنسبة لفجوة الطول n ، ستكون تكلفة الفجوة G + Ln. يعد اختيار تكاليف الفجوة ، G و L تجريبيًا ، ولكن من المعتاد اختيار قيمة عالية لـ G (10-15) وقيمة منخفضة لـ L (1-2).
إطار القراءة من كتاب جوسفيلد: "واحد من ثلاثة أماكن لبدء القراءة عند ترجمة سلسلة من أبجدية الحمض النووي إلى أبجدية الأحماض الأمينية. إذا لم يتم تحديد اتجاه السلسلة أيضًا ، فإنها تشير إلى أحد إطارات القراءة الستة". (ثلاثة من كل من الخيوط المتعارضة).

من الضروري الحفاظ على الإطار من أجل إنتاج تسلسل الأحماض الأمينية الصحيح: قد تتسبب طفرة الإدراج / الحذف في تحول الإطار وله واحد من عدة تداعيات ، على سبيل المثال: 1) قد يغير القراءة الأصلية للكودونات ، بتوليد تسلسل جديد للأحماض الأمينية أو / و 2) قد يؤدي إلى توقف جديد للتغاضي ، وبالتالي إنشاء بروتين مبتور أو ، اعتمادًا على مكان حدوث الطفرة ، يمكنه منع الترجمة تمامًا.
SEG برنامج لتصفية المناطق منخفضة التعقيد في تسلسل الأحماض الأمينية. البقايا التي تم حجبها يتم تمثيلها على أنها "X" في المحاذاة. يتم إجراء ترشيح SEG افتراضيًا في روتين التفجير الفرعي لـ BLAST 2.0. (ووتون وفيدرهين)
الطفرات الصامتة من كتاب Gusfield: "طفرة في كودون DNA لا تغير الحمض الأميني المحدد. في أغلب الأحيان ، طفرة صامتة في النوكليوتيدات الثالثة في Condon."
تشابه مدى ارتباط تسلسل النوكليوتيدات أو البروتين. يمكن أن يعتمد مدى التشابه بين تسلسلين على النسبة المئوية لهوية التسلسل و / أو الحفظ. يشير التشابه في بلاست إلى درجة مصفوفة موجبة.
تسلسل مرور واحد Single pass means that a sequence has been analized on the sequencer machine only once. Generally, when the researcher is looking for the precise sequence of a clone, the sequencing reaction is served serveral times, each at a different time interval and in a separate lane of the sequencing gel. This is to produce an overlaping series of reads (all coming from the same clone and same reaction) that is used both to corroborate the sequence (by depth provided by overlap) and to extend beyond the natural length achievable in one lane by the size of the gel and by band distorsions at the bottom of the gel. It is sometimes called walking reads in a directed approach (new primers can be designed from the learned sequence to amplify and continue the walking).

Single pass is avoiding all these expensive checkups, and a reaction is loaded only one time in one lane, meaning that only one sample sequence is obtained from a given clone. Instead it relies in finding random overlaps with other clones in a shotgun sequencing approach. NOTE: In this past definition, I assume that a single lane is enough to see all four bases, as in multiplexed gel loading.
سلسلة An ordered sequence of letters from a given alphabet. A substring is defined as a contigous subset (portion) of a string.
Sequence Tagged Site (STS) From Gusfield's book: "Roughly, a short DNA sequence that occurs only once in the genome. More exactly, a pair of PCR primers within a bounded distance, with the property that PCR succeeds using them at only one location in the genome. STS provide markers throughout the genome, but they need not be located in genes, in contrast to ESTs".
الاستبدال The presence of a non-identical amino acid at a given position in an alignment. If the aligned residues have similar physico-chemical properties the substitution is said to be "conservative".
Substitution Matrix A substitution matrix containing values proportional to the probability that amino acid i mutates into amino acid j for all pairs of amino acids. such matrices are constructed by assembling a large and diverse sample of verified pairwise alignments of amino acids. If the sample is large enough to be statistically significant, the resulting matrices should reflect the true probabilities of mutations occuring through a period of evolution.
Unitary Matrix Also known as Identity Matrix. A scoring system in which only identical characters receive a positive score.


شاهد الفيديو: حساب الاحتمالات: الجزء 10 الاحتمالات الشرطية - probabilité conditionnelle (أغسطس 2022).