列出给出序列的crispr 引物

列出给出序列的crispr 引物 - OA_maque

OA-maque 2021-08-07 原文

列出给出序列的crispr 引物

手动寻找cripsr 引物比较麻烦，而现在有些网站可以完成这一任务，但是，用python 去实现它也很简单。以下是脚本：

 1 #!/usr/bin/python
 2 # list all crispr-target(20 bp + NGG)
 3 
 4 import re
 5 from Bio.Seq import reverse_complement   # use Biopython module
 6 
 7 genome_seq = open("seq.txt")
 8 crispr_list = open("crispr_list.txt", "a")    # \'a\' 指的是 append
 9 
10 sequence = ""
11 for line in genome_seq:
12     sequence = sequence + line.rstrip("\n")  # use str.rstrip() method
13 
14 def GC_number(seq):
15     num_G = seq.count(\'G\')
16     num_C = seq.count(\'C\')
17     GC_number = num_G + num_C
18     return GC_number
19 
20 for i in range(0, len(sequence)):
21     target = sequence[i:i+23]
22     
23     if re.search(r\'[ATCG]{21}GG$\', target):    # use regular expression
24     start = i + 1
25     end   = i + 20
26     target = "+ " + target + " from " + str(start) + " to " + str(end) +  "---" + "GC_number = " +  str(GC_number(target))
27     crispr_list.write(target + "\n")     # add \'\n\'
28     #print(target)
29 
30 RC_sequence = reverse_complement(sequence)   # 调用上面的 reverse_complement() method
31 
32 for i in range(0, len(RC_sequence)):
33     target = RC_sequence[i:i+23]
34     
35     if re.search(r\'[ATCG]{21}GG$\', target):
36     start = i + 1
37     end   = i + 20
38     target = "- " + target + " from " + str(start) + " to " + str(end) +  "---" + "GC_number = " +  str(GC_number(target))
39     crispr_list.write(target + "\n")
40     #print(target)
41 
42 genome_seq.close()
43 crispr_list.close()

理论上，这正则表达式更直接和简单，但是以下代码的结果远远少于上面方法的结果：

1 dna = sequence
2 runs = re.findall(r\'[ATCG]{21}GG\', dna)
3 for match in runs:
4     #print(str(match))

目前还不是很清楚原因。

本文链接：https://www.cnblogs.com/OA-maque/p/4808859.html

列出给出序列的crispr 引物 - OA_maque的更多相关文章

C语言初学者应该知道的（一） – Leon_He

C语言初学者应该知道的（一） C语言初学者应该知道的（一） ——编码风格与规范一个程序员的编码水平如何，从他 […]...

Java资料大全(视频内容包含源码) – L的存在

Java资料大全(视频内容包含源码) 转眼间已经到了六月，陆陆续续不少小伙伴需要学习资料，我将资料进行了一个整 […]...

win10系统安装之GHOST还原（转+编辑） – PandOne

win10系统安装之GHOST还原（转+编辑）注意*：在以下操作中，你可能需要分区你的原来系统盘，如果是 […]...

学习笔记

<Machine Learning – 李宏毅> 学习笔记 b站视频地址：李宏毅< […]...

分享一次大厂的辛酸面试经历 – 逆锋起笔

分享一次大厂的辛酸面试经历本文来源：相学长链接：https://juejin.im/post/5b9b47 […]...

检测 iOS 的 APP 性能的一些方法 – Hi,David

检测 iOS 的 APP 性能的一些方法 2017-02-20 11:44 Hi,David 阅读(535 […]...

递归算法详细分析 – AlanTu

递归算法详细分析递归的理解与设计递归算法：是一种直接或者间接地调用自身的算法。在计算机编写程序中，递归算法 […]...

C 语言实例 – 判断三个数中的最大数。

通过屏幕我们输入三个数字，并找出最大的数。 #include <stdio.h>int main( […]...

随机推荐

【web开发】docker中的数据库

注：自从开始使用docker，部署方面的事情就简单多了。使用docker构建的数据库容器不用直接安装，开启后就 […]...

Linux下如何查看tomcat是否启动/系统日志等

1、在Linux系统下，重启Tomcat使用命令操作的！方法一：首先，进入Tomcat下的b […]...

QWebEngineView_简单例子_01

工程名 : WebEngine01 1、WebEngine01.pro #------------------ […]...

使用图数据库 Nebula Graph 数据导入快速体验知识图谱 OwnThink

本文介绍如何使用图数据库 Nebula Graph 将中文知识图谱 OwnThink 的数据快速导入，并进行 […]...

让微信推送Jenkins构建消息

　　Jenkins作为开发必备之神器，各家大小公司都在使用。Jenkins自身内置了基于邮件推送构建结果的功能 […]...

ES6知识整理（9）–class的基本语法

（总结完知识点，出去滑板刷街） promise的catch 上一节promise中漏了一个知识点： promi […]...

Ubuntu命令方式安装中文语言包

Ubuntu命令方式安装中文语言包安装之前执行 $LANG 查看语言环境中文语言包: language-p […]...

用python把技术文档中，每个模块系列截图生成一个动态GIF

前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系 […]...

列出给出序列的crispr 引物 - OA_maque