生信分析案例 Python简明教程 | 视频11

开源生信 Python教程

生信专用简明 Python 文字和视频教程

源码在:https://github.com/Tong-Chen/Bioinfo_course_python

目录

  1. 背景介绍

    1. 编程开篇

    2. 为什么学习Python

    3. 如何安装Python

    4. 如何运行Python命令和脚本

    5. 使用什么编辑器写Python脚本

  2. Python程序事例

  3. Python基本语法

    1. 数值变量操作

    2. 字符串变量操作

    3. 列表操作

    4. 集合操作

    5. Range使用

    6. 字典操作

    7. 层级缩进

    8. 变量、数据结构、流程控制

  4. 输入输出

    1. 交互式输入输出

    2. 文件读写

  5. 实战练习(一)

    1. 背景知识

    2. 生信相关作业(一)

  6. 函数操作

    1. 函数操作

    2. 生信相关作业(二)

  7. 模块

  8. 命令行参数

    1. 命令行参数

    2. 生信相关作业(三)

  9. 更多Python内容

    1. 单语句块

    2. 列表综合,生成新列表的简化的for循环

    3. lambda, map, filer, reduce (保留节目)

    4. exec, eval (执行字符串python语句, 保留节目)

    5. 正则表达式

    6. Python画图

  10. Reference

一些练习题

  1. 给定FASTA格式的文件(test1.fa 和 test2.fa),写一个程序 cat.py 读入文件,并输出到屏幕 (2分)

  • open(file)

  • for .. in loop

  • print()

  • strip() function

  • 用到的知识点

给定FASTQ格式的文件(test1.fq), 写一个程序 cat.py 读入文件,并输出到屏幕 (2分)

  • 同上

  • 用到的知识点

写程序 splitName.py, 读入test2.fa, 并取原始序列名字第一个空格前的名字为处理后的序列名字,输出到屏幕 (2分)

  • split

  • 字符串的索引

  • 用到的知识点

  • 输出格式为:

    >NM_001011874
    gcggcggcgggcgagcgggcgctggagtaggagctg.......

写程序 formatFasta.py, 读入test2.fa,把每条FASTA序列连成一行然后输出 (2分)

  • join

  • strip

  • 用到的知识点

  • 输出格式为:

    >NM_001011874
    gcggcggcgggc......TCCGCTG......GCGTTCACC......CGGGGTCCGGAG

写程序 formatFasta-2.py, 读入test2.fa,把每条FASTA序列分割成80个字母一行的序列 (2分)

  • 字符串切片操作

  • range

  • 用到的知识点

  • 输出格式为

    >NM_001011874
    gcggcggcgc.(60个字母).TCCGCTGACG #(每行80个字母)
    acgtgctacg.(60个字母).GCGTTCACCC
    ACGTACGATG(最后一行可不足80个字母)

写程序 sortFasta.py, 读入test2.fa, 并取原始序列名字第一个空格前的名字为处理后的序列名字,排序后输出 (2分)

  • sort

  • dict

  • aDict[key] = []

  • aDict[key].append(value)

  • 用到的知识点

提取给定名字的序列 (2分)

  • 用到的知识点

  • print >>fh, or fh.write()

  • 取模运算,4 % 2 == 0

  • 写程序 grepFasta.py, 提取fasta.name中名字对应的test2.fa的序列,并输出到屏幕。

  • 写程序 grepFastq.py, 提取fastq.name中名字对应的test1.fq的序列,并输出到文件。

写程序 screenResult.py, 筛选test.expr中foldChange大于2的基因并且padj小于0.05的基,可以输出整行或只输出基因名字。(4分)

  • 逻辑与操作符 and

  • 文件中读取的内容都为字符串,需要用int转换为整数,float转换为浮点数

  • 用到的知识点

写程序 transferMultipleColumToMatrix.py 将文件(multipleColExpr.txt)中基因在多个组织中的表达数据转换为矩阵形式,并绘制热图。(6分)

  • aDict[‘key’] = {}

  • aDict[‘key’][‘key2’] = value

  • if key not in aDict

  • aDict = {‘ENSG00000000003’: {“A-431”: 21.3, “A-549”, 32.5,…},”ENSG00000000003”:{},}

  • 用到的知识点

  • 输入格式(只需要前3列就可以)

    Gene    Sample  Value   Unit    Abundance
    ENSG00000000003 A-431   21.3    FPKM    Medium
    ENSG00000000003 A-549   32.5    FPKM    Medium
    ENSG00000000003 AN3-CA  38.2    FPKM    Medium
    ENSG00000000003 BEWO    31.4    FPKM    Medium
    ENSG00000000003 CACO-2  63.9    FPKM    High
    ENSG00000000005 A-431   0.0     FPKM    Not detected
    ENSG00000000005 A-549   0.0     FPKM    Not detected
    ENSG00000000005 AN3-CA  0.0     FPKM    Not detected
    ENSG00000000005 BEWO    0.0     FPKM    Not detected
    ENSG00000000005 CACO-2  0.0     FPKM    Not detected
  • 输出格式

    Name    A-431    A-549    AN3-CA    BEWO    CACO-2
    ENSG00000000460    25.2    14.2    10.6    24.4    14.2
    ENSG00000000938    0.0    0.0    0.0    0.0    0.0
    ENSG00000001084    19.1    155.1    24.4    12.6    23.5
    ENSG00000000457    2.8    3.4    3.8    5.8    2.9

写程序 reverseComplementary.py计算序列 ACGTACGTACGTCACGTCAGCTAGAC的反向互补序列。(2分)

  • reverse

  • list(seq)

  • 用到的知识点

写程序 collapsemiRNAreads.py转换smRNA-Seq的测序数据。(5分)

  • 输入文件格式(mir.collapse, tab-分割的两列文件,第一列为序列,第二列为序列被测到的次数)

    ID_REF        VALUEACTGCCCTAAGTGCTCCTTCTGGC        2ATAAGGTGCATCTAGTGCAGATA        25TGAGGTAGTAGTTTGTGCTGTTT        100TCCTACGAGTTGCATGGATTC        4
  • 输出文件格式 (mir.collapse.fa, 名字的前3个字母为样品的特异标示,中间的数字表示第几条序列,是序列名字的唯一标示,第三部分是x加每个reads被测到的次数。三部分用下划线连起来作为fasta序列的名字。)

    >ESB_1_x2ACTGCCCTAAGTGCTCCTTCTGGC>ESB_2_x25ATAAGGTGCATCTAGTGCAGATA>ESB_3_x100TGAGGTAGTAGTTTGTGCTGTTT>ESB_4_x4TCCTACGAGTTGCATGGATTC

简化的短序列匹配程序 (map.py) 把short.fa中的序列比对到ref.fa, 输出短序列匹配到ref.fa文件中哪些序列的哪些位置。(10分)

  • find

  • 用到的知识点

  • 输出格式 (输出格式为bed格式,第一列为匹配到的染色体,第二列和第三列为匹配到染色体序列的起始终止位置(位置标记以0为起始,代表第一个位置;终止位置不包含在内,第一个例子中所示序列的位置是(199,208](前闭后开,实际是chr1染色体第199-206的序列,0起始). 第4列为短序列自身的序列.)。

  • 附加要求:可以只匹配到给定的模板链,也可以考虑匹配到模板链的互补链。这时第5列可以为短序列的名字,第六列为链的信息,匹配到模板链为’+’,匹配到互补链为’-‘。注意匹配到互补链时起始位置也是从模板链的5’端算起的。

    chr1    199    208    TGGCGTTCA
    chr1    207    216    ACCCCGCTG
    chr2    63    70    AAATTGC
    chr3    0    7    AATAAAT

每日书籍推荐 - 流畅的Python

《流畅的Python》作者卢西亚诺·拉马略(Luciano Ramalho) 是Thoughtworks 首席咨询师、Python 软件基金会成员、巴西知名 Python 语言学习社区 Python Brasil 联合创始人。拥有 25 年 Python 编程经验,他的《流畅的Python》是编程领域经典作品,影响近 8 万读者,基于Python 3.10,内容详尽,精心设计的代码示例有近 500 段!还有大量的图和表,简直对学习真的太友好了!。

具体看ChatGPT的评价:

339e8f2b75f5538912daad23aed3b816.png

e9a2d9613a15a7b80da4b2c5ad7fa873.png

fa023fa9113318887bcff11a1091a6de.png

往期精品(点击图片直达文字对应教程)

1bbe38cffb0c86e07fac16fbdc0defc4.jpeg

68f1183620539a0cb395351ee54ee2db.jpeg

b7d8653c1be860824eaa07fcde9ae927.jpeg

172c1a51d0524d6445918ff258fb8ec1.jpeg

4b518c9343042350873e77d1caed9c9b.jpeg

53259b74b0a26f54b6bb9ff94edc9be0.jpeg

8ace5e5c7d316093dee25c3a93a9af34.jpeg

d04b38c83851609459bb17b19e42319b.jpeg

3800816fe6b5919c5b9d9f820782181a.jpeg

5929ff37be1e27233b02f2cd767aabcc.jpeg

c9deabc918ed59e4d3cfd58e005e680f.jpeg

c7f89bdc0079afa319d35471291d9438.jpeg

8abd5b046d8e7f65c0bd0af1ffcac697.png

50c45da968b3b84055392ddca133084d.png

1095df545cc03a6307660b68c71fe7ac.png

ef1365e02a3e7c751ad2d35a5586a06c.png

5b43f6c8487b863522b929dd8f3c524b.jpeg

741929bd6fb92d118371046514a1db56.jpeg

269a6066b6a5ffa5583d24c8d52d84c6.jpeg

8f2b8869d069d7a1f4114d5962c09f4e.jpeg

8f2c92eea82e945669f3b3bdee17db7d.png

b6f3558d7b10e3deabe85e4594d54804.png

97a236d831284d73787c8f6fc3df61fb.jpeg

4c0072fbcdfa7464b821f6f9f19e0aa4.png

5903a7d7a2f3ba180410deb075711ec7.png

3206220aa0f8e436e2c4890c1d1c73f7.jpeg

52a6ae71bf34d615d12e3e6ee57b93bc.png

2d5e2e242f3f364a6e627cdf9e9b30da.png

机器学习

后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集

4e37ce298728ad8729f9801a2ce1a63f.jpeg

46df1d7ebf35c9f07be8af8b9ca609e6.jpeg

55d95db8239c2176d01ae113e2408b47.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/38999.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

12款好用的Visual Studio插件,最后一款良心推荐

工欲善其事,必先利其器,整理的一些我必装的12款Visual Studio插件,希望你们能get到。 效率工具前文传送门: adb常用命令总结 程序员你可以考虑安装的15款谷歌插件 推荐20套实战源码 99%的人不知道搜索引擎的6个技巧 12款好用的Visual Stu…

七年磨一剑!苹果王炸产品Vision Pro诞生,未来已来

这是第一款「不见却可透见」的苹果产品 等了整整七年!2023年6月5日,WWDC23大会上,苹果发布首款头显Vision Pro,Vision Pro 可以算是苹果公司自 2015 年 Apple Watch 首次亮相以来最大的硬件产品发布,或许它会彻底改变数…

chatgpt赋能python:人机对话Python——让交互更智能

人机对话Python——让交互更智能 随着科技的不断发展,人类与机器之间的交互方式也在不断改变。从最初的键盘输入和鼠标点击,到现在的语音识别和手势交互,我们与计算机之间的交互方式日益智能化和自然化。人机对话技术就是其中一种重要的交互…

紫砂典故之“蔓生石瓢”

紫砂典故之“蔓生石瓢”

如何区分纯正紫砂底料

首先大家要区分一个概念,就是纯正的底料和调砂不是同一个概念,调砂其实是紫泥中的石英颗粒,调砂可以增强泥料的可塑性,增强了透气性,以及增加质感。纯的底料,不是那么坚硬,经过一到两天&#xf…

18把紫砂壶上了邮票:今起来厦展出

制壶高工沈龙娣,花了1年时间,纯手工打造了18把紫砂壶,然后由当代著名花鸟画家张贤明院长赴阳羡亲绘壶身,最后请中国第一批省级大师鲍仲 梅篆刻。最为难得的是,这套紫砂壶还上了邮票,由国家邮政总局限量发行…

怎么看安装包是什么bit的_什么是紫砂壶太阳线,怎么看?-紫砂壶

经常能在紫砂壶内的底部,见到一种由中心向四周呈发散状,如太阳光芒线的泥痕,称之为“太阳线”。 常见的模具壶,一般都是以“外模内挡”的成型方式为主,“挡”成后,壶的内壁表面会因受力不均而出现凹凸不平&…

用计算机3d建模做紫砂壶好吗,做3D行业千万别被骗了!建模一点都不难!这一步才是最难的!...

闲来无事逛推特,发现竟然有大神开发了一个建模神器。在像素网格绘制好平面图,再设置下相关参数,就能生成一个3D锤子模型了,妙啊… 其实Windows10系统也有类似的傻瓜式建模软件,叫“画图3D”,它能帮你秒速建…

用计算机3d建模做紫砂壶好吗,3D建模制壶,走在制壶科技的前沿——潘洪强

原标题:3D建模制壶,走在制壶科技的前沿——潘洪强 每一种工艺都有其独特的美,他用艺术的眼光探寻,借助科技缔造出完美的紫砂艺术品。 潘洪强,宜兴紫砂圈的人才。他会做壶,有创意,灵活运用科技的…

扫黑牵出制壶大师,紫砂壶真的那么值钱?

特约作者| 与归 近日,江苏省宜兴市检察院通报了一则消息:该院依法以涉嫌敲诈勒索罪、寻衅滋事罪,对在宜兴市紫砂行业以打假为由,多次采用拘禁、殴打、上门滋扰等手段实施违法犯罪活动的邵洪群、许鹏、吴浩、盛云峰等4名恶势力犯罪…

用手刻出计算机系统,紫砂壶电脑刻字和手工刻字,你看得出吗?

原标题:紫砂壶电脑刻字和手工刻字,你看得出吗? 刻字即用刀在木头或石头上雕刻出文字或者图画,紫砂壶刻字亦是如此,就是在壶壁上雕刻出文字和图画。 “ 紫砂壶陶刻 紫砂壶大体分为光货,花货,筋纹…

最理想的饮茶器具──紫砂壶

饮茶习惯在我国有着悠久的历史,古代文人雅士平时经常聚集一起,且鼎且缶,以啜以饮,视为可获得无穷的情趣。据汉代《华阳国志》,司马相如《凡将篇》和杨雄的《方言》等书中记录了,武王伐纣时就出现将茶作为贡…

基于SSM的紫砂壶交易系统

紫砂壶交易系统采用了jsp的mvc框架,SSM(springMvcspringMybatis))框架进行开发,主要实现了从紫砂壶管理,紫砂壶分类和查询,到紫砂壶车实现,用户订单处理,再到系统管理。基本上实现了网上购物的功能流程,能够实现用户与…

江南情节——紫砂壶品茶

很多人有江南情结,故江南水乡引来八方宾客。人们经常会想起,那一次烟雨痴迷时节,撑一把油纸伞,走过水边小巷,选一处静静的茶楼,掏出随身携带的紫砂壶,此壶经数年泡养,略有小成。 静…

[日推荐] 『紫砂壶平台』一把紫砂,一种品味

最近小编一直想喝茶,但胃不是很好,又不敢喝,想当年小编喝茶是有讲究的啊,只喝人参乌龙茶,杯子只用紫砂杯或紫砂壶。人生境界瞬间提高。 不过小编那时喝茶真的不叫喝茶,叫吃茶~叶!So。。。胃病犯…

走进紫砂老泥料

泥料是紫砂壶中最重要的一关,但现在很多壶友对新、老泥料之说存在误区,所有的紫砂泥料至今都是经历了上千年甚至上亿年的时间,都可称之为老泥料,而我们平时说的老泥料实际上是指陈腐时间较长的泥料,从某种程度上来讲泥…

紫砂壶的起源 计算机操作题,简析紫砂壶筋瓤器的起源与发展

原标题:简析紫砂壶筋瓤器的起源与发展 紫砂壶,因其造型艺术之美,形制之多,文化气息之丰富,被人们称为是一座伟大的艺术宝库。 从形而言,紫砂壶有取材于动物和植物两个内容的造型。动物,过去通常…

紫砂壶的起源 计算机操作题,紫砂壶的起源与历史发展你知道吗?

原标题:紫砂壶的起源与历史发展你知道吗? 紫砂壶始于北宋,1976年,宜兴羊角山紫砂古窑出土,被认为宜兴紫砂源自宋代的依据。宜兴羊角山古窑址调查文稿曾指“上限不早于北宋中期,盛于南宋,下限延至…

紫砂壶的起源 计算机操作题,紫砂壶的起源与历史发展

茶文化是中国文化中不可或缺的一部分。古人云:开门七件事,柴米油盐酱醋茶。可见茶与生活息息相关,现在正值酷暑,最适合夏天的饮品就是茶了。夏天泡茶的佳器当属紫砂器。紫砂壶的原产地在江苏宜兴丁蜀镇又名宜兴紫砂壶。据说紫砂壶…

紫砂壶型和泥料适配茶叶

一、壶型 1、紫砂壶泡茶,一般是壶音频率较高者,适宜配泡重香气的茶叶,如青茶;壶音稍低者较宜配泡重滋味的茶,如乌龙、铁观音。 壶音频率:是将壶盖取下,一手托住壶身一手用壶盖轻敲壶把产生的声音 2、容量在200ml以下…