生信分析案例 Python简明教程 | 视频13

开源生信 Python教程

生信专用简明 Python 文字和视频教程

源码在:https://github.com/Tong-Chen/Bioinfo_course_python

目录

  1. 背景介绍

    1. 编程开篇

    2. 为什么学习Python

    3. 如何安装Python

    4. 如何运行Python命令和脚本

    5. 使用什么编辑器写Python脚本

  2. Python程序事例

  3. Python基本语法

    1. 数值变量操作

    2. 字符串变量操作

    3. 列表操作

    4. 集合操作

    5. Range使用

    6. 字典操作

    7. 层级缩进

    8. 变量、数据结构、流程控制

  4. 输入输出

    1. 交互式输入输出

    2. 文件读写

  5. 实战练习(一)

    1. 背景知识

    2. 生信相关作业(一)

  6. 函数操作

    1. 函数操作

    2. 生信相关作业(二)

  7. 模块

  8. 命令行参数

    1. 命令行参数

    2. 生信相关作业(三)

  9. 更多Python内容

    1. 单语句块

    2. 列表综合,生成新列表的简化的for循环

    3. lambda, map, filer, reduce (保留节目)

    4. exec, eval (执行字符串python语句, 保留节目)

    5. 正则表达式

    6. Python画图

  10. Reference

一些练习题

  1. 给定FASTA格式的文件(test1.fa 和 test2.fa),写一个程序 cat.py 读入文件,并输出到屏幕 (2分)

  • open(file)

  • for .. in loop

  • print()

  • strip() function

  • 用到的知识点

给定FASTQ格式的文件(test1.fq), 写一个程序 cat.py 读入文件,并输出到屏幕 (2分)

  • 同上

  • 用到的知识点

写程序 splitName.py, 读入test2.fa, 并取原始序列名字第一个空格前的名字为处理后的序列名字,输出到屏幕 (2分)

  • split

  • 字符串的索引

  • 用到的知识点

  • 输出格式为:

    >NM_001011874
    gcggcggcgggcgagcgggcgctggagtaggagctg.......

写程序 formatFasta.py, 读入test2.fa,把每条FASTA序列连成一行然后输出 (2分)

  • join

  • strip

  • 用到的知识点

  • 输出格式为:

    >NM_001011874
    gcggcggcgggc......TCCGCTG......GCGTTCACC......CGGGGTCCGGAG

写程序 formatFasta-2.py, 读入test2.fa,把每条FASTA序列分割成80个字母一行的序列 (2分)

  • 字符串切片操作

  • range

  • 用到的知识点

  • 输出格式为

    >NM_001011874
    gcggcggcgc.(60个字母).TCCGCTGACG #(每行80个字母)
    acgtgctacg.(60个字母).GCGTTCACCC
    ACGTACGATG(最后一行可不足80个字母)

写程序 sortFasta.py, 读入test2.fa, 并取原始序列名字第一个空格前的名字为处理后的序列名字,排序后输出 (2分)

  • sort

  • dict

  • aDict[key] = []

  • aDict[key].append(value)

  • 用到的知识点

提取给定名字的序列 (2分)

  • 用到的知识点

  • print >>fh, or fh.write()

  • 取模运算,4 % 2 == 0

  • 写程序 grepFasta.py, 提取fasta.name中名字对应的test2.fa的序列,并输出到屏幕。

  • 写程序 grepFastq.py, 提取fastq.name中名字对应的test1.fq的序列,并输出到文件。

写程序 screenResult.py, 筛选test.expr中foldChange大于2的基因并且padj小于0.05的基,可以输出整行或只输出基因名字。(4分)

  • 逻辑与操作符 and

  • 文件中读取的内容都为字符串,需要用int转换为整数,float转换为浮点数

  • 用到的知识点

写程序 transferMultipleColumToMatrix.py 将文件(multipleColExpr.txt)中基因在多个组织中的表达数据转换为矩阵形式,并绘制热图。(6分)

  • aDict[‘key’] = {}

  • aDict[‘key’][‘key2’] = value

  • if key not in aDict

  • aDict = {‘ENSG00000000003’: {“A-431”: 21.3, “A-549”, 32.5,…},”ENSG00000000003”:{},}

  • 用到的知识点

  • 输入格式(只需要前3列就可以)

    Gene    Sample  Value   Unit    Abundance
    ENSG00000000003 A-431   21.3    FPKM    Medium
    ENSG00000000003 A-549   32.5    FPKM    Medium
    ENSG00000000003 AN3-CA  38.2    FPKM    Medium
    ENSG00000000003 BEWO    31.4    FPKM    Medium
    ENSG00000000003 CACO-2  63.9    FPKM    High
    ENSG00000000005 A-431   0.0     FPKM    Not detected
    ENSG00000000005 A-549   0.0     FPKM    Not detected
    ENSG00000000005 AN3-CA  0.0     FPKM    Not detected
    ENSG00000000005 BEWO    0.0     FPKM    Not detected
    ENSG00000000005 CACO-2  0.0     FPKM    Not detected
  • 输出格式

    Name    A-431    A-549    AN3-CA    BEWO    CACO-2
    ENSG00000000460    25.2    14.2    10.6    24.4    14.2
    ENSG00000000938    0.0    0.0    0.0    0.0    0.0
    ENSG00000001084    19.1    155.1    24.4    12.6    23.5
    ENSG00000000457    2.8    3.4    3.8    5.8    2.9

写程序 reverseComplementary.py计算序列 ACGTACGTACGTCACGTCAGCTAGAC的反向互补序列。(2分)

  • reverse

  • list(seq)

  • 用到的知识点

写程序 collapsemiRNAreads.py转换smRNA-Seq的测序数据。(5分)

  • 输入文件格式(mir.collapse, tab-分割的两列文件,第一列为序列,第二列为序列被测到的次数)

    ID_REF        VALUEACTGCCCTAAGTGCTCCTTCTGGC        2ATAAGGTGCATCTAGTGCAGATA        25TGAGGTAGTAGTTTGTGCTGTTT        100TCCTACGAGTTGCATGGATTC        4
  • 输出文件格式 (mir.collapse.fa, 名字的前3个字母为样品的特异标示,中间的数字表示第几条序列,是序列名字的唯一标示,第三部分是x加每个reads被测到的次数。三部分用下划线连起来作为fasta序列的名字。)

    >ESB_1_x2ACTGCCCTAAGTGCTCCTTCTGGC>ESB_2_x25ATAAGGTGCATCTAGTGCAGATA>ESB_3_x100TGAGGTAGTAGTTTGTGCTGTTT>ESB_4_x4TCCTACGAGTTGCATGGATTC

简化的短序列匹配程序 (map.py) 把short.fa中的序列比对到ref.fa, 输出短序列匹配到ref.fa文件中哪些序列的哪些位置。(10分)

  • find

  • 用到的知识点

  • 输出格式 (输出格式为bed格式,第一列为匹配到的染色体,第二列和第三列为匹配到染色体序列的起始终止位置(位置标记以0为起始,代表第一个位置;终止位置不包含在内,第一个例子中所示序列的位置是(199,208](前闭后开,实际是chr1染色体第199-206的序列,0起始). 第4列为短序列自身的序列.)。

  • 附加要求:可以只匹配到给定的模板链,也可以考虑匹配到模板链的互补链。这时第5列可以为短序列的名字,第六列为链的信息,匹配到模板链为’+’,匹配到互补链为’-‘。注意匹配到互补链时起始位置也是从模板链的5’端算起的。

    chr1    199    208    TGGCGTTCA
    chr1    207    216    ACCCCGCTG
    chr2    63    70    AAATTGC
    chr3    0    7    AATAAAT

每日书籍推荐 - 流畅的Python

《流畅的Python》作者卢西亚诺·拉马略(Luciano Ramalho) 是Thoughtworks 首席咨询师、Python 软件基金会成员、巴西知名 Python 语言学习社区 Python Brasil 联合创始人。拥有 25 年 Python 编程经验,他的《流畅的Python》是编程领域经典作品,影响近 8 万读者,基于Python 3.10,内容详尽,精心设计的代码示例有近 500 段!还有大量的图和表,简直对学习真的太友好了!。

具体看ChatGPT的评价:

8cae5f814fc47bf1988f4ada90ca95b0.png

25e15343cb3001e397096d8d47074177.png

163c3eed31f215af6f8c72356dc158cf.png

往期精品(点击图片直达文字对应教程)

45e63f1dc31c07187817d3a70f521413.jpeg

adf2ade46be67c2bf49a21d9ad9a6484.jpeg

480b7239c9b7b020284775afdc9cc0bc.jpeg

12b2da96c34242746e9178b56ec88969.jpeg

a5a176a24dacb45b02915a5a400c5480.jpeg

4293e6fa65830d73d8bc0abde7baee94.jpeg

09e31ab3d56d790e77af1e7db266ffcb.jpeg

2ca29ba33b73d783c3546de8ae183004.jpeg

5a4a3b41aaa5a05ebe8044502654bb67.jpeg

3f472a39ceb447e2633652198a12e166.jpeg

511add924a54db306592845842fe28e4.jpeg

ab098e797a074941c88ca06e53745479.jpeg

c47b2e30ccb681a95d3866c9d0b20938.png

5179ee66f8b3172147fca77dcfd8c331.png

b55be7717b21ef8d4dc9927a59b81f6d.png

c93884d1a740f74368624d2edbdb00cc.png

8f6050345d7d43b1803ae5e877117bf0.jpeg

bdbd8b1485f5caa6ef8317e9a50bb07d.jpeg

8c52cade189b6c64fba29720e7c15ed6.jpeg

ff1aef195ffc62712e408b76e78d57de.jpeg

283b2500abdada153a1314e4527ef21d.png

85fa6e3baac01ec8ff5a189ea7a103b2.png

e1eb987ac46ad810ed13d1854b4fd596.jpeg

a34d1963273d060ace7a628794762fa6.png

fa9e5356b86b4912b81230417e3b6a7d.png

f781dbfd8f14d36cfb624d2ad5bd7cb4.jpeg

6fb97653272f0cdf670f13884505aaca.png

07b6d23cc1a1a87ed172d115f677c47e.png

机器学习

后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集

bc37a1dc0fb8b07d3b875c55e90d78d3.jpeg

c363be49d6c5d47bd1382bb8a5ec99fc.jpeg

9cc5975b28c944918a3b3ce7c3b3018f.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/39001.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

生信分析案例 Python简明教程 | 视频12

开源生信 Python教程 生信专用简明 Python 文字和视频教程 源码在:https://github.com/Tong-Chen/Bioinfo_course_python 目录 背景介绍 编程开篇为什么学习Python如何安装Python如何运行Python命令和脚本使用什么编辑器写Python脚本Python程序事例Python基本语法 数…

生信分析案例 Python简明教程 | 视频11

开源生信 Python教程 生信专用简明 Python 文字和视频教程 源码在:https://github.com/Tong-Chen/Bioinfo_course_python 目录 背景介绍 编程开篇为什么学习Python如何安装Python如何运行Python命令和脚本使用什么编辑器写Python脚本Python程序事例Python基本语法 数…

12款好用的Visual Studio插件,最后一款良心推荐

工欲善其事,必先利其器,整理的一些我必装的12款Visual Studio插件,希望你们能get到。 效率工具前文传送门: adb常用命令总结 程序员你可以考虑安装的15款谷歌插件 推荐20套实战源码 99%的人不知道搜索引擎的6个技巧 12款好用的Visual Stu…

七年磨一剑!苹果王炸产品Vision Pro诞生,未来已来

这是第一款「不见却可透见」的苹果产品 等了整整七年!2023年6月5日,WWDC23大会上,苹果发布首款头显Vision Pro,Vision Pro 可以算是苹果公司自 2015 年 Apple Watch 首次亮相以来最大的硬件产品发布,或许它会彻底改变数…

chatgpt赋能python:人机对话Python——让交互更智能

人机对话Python——让交互更智能 随着科技的不断发展,人类与机器之间的交互方式也在不断改变。从最初的键盘输入和鼠标点击,到现在的语音识别和手势交互,我们与计算机之间的交互方式日益智能化和自然化。人机对话技术就是其中一种重要的交互…

紫砂典故之“蔓生石瓢”

紫砂典故之“蔓生石瓢”

如何区分纯正紫砂底料

首先大家要区分一个概念,就是纯正的底料和调砂不是同一个概念,调砂其实是紫泥中的石英颗粒,调砂可以增强泥料的可塑性,增强了透气性,以及增加质感。纯的底料,不是那么坚硬,经过一到两天&#xf…

18把紫砂壶上了邮票:今起来厦展出

制壶高工沈龙娣,花了1年时间,纯手工打造了18把紫砂壶,然后由当代著名花鸟画家张贤明院长赴阳羡亲绘壶身,最后请中国第一批省级大师鲍仲 梅篆刻。最为难得的是,这套紫砂壶还上了邮票,由国家邮政总局限量发行…

怎么看安装包是什么bit的_什么是紫砂壶太阳线,怎么看?-紫砂壶

经常能在紫砂壶内的底部,见到一种由中心向四周呈发散状,如太阳光芒线的泥痕,称之为“太阳线”。 常见的模具壶,一般都是以“外模内挡”的成型方式为主,“挡”成后,壶的内壁表面会因受力不均而出现凹凸不平&…

用计算机3d建模做紫砂壶好吗,做3D行业千万别被骗了!建模一点都不难!这一步才是最难的!...

闲来无事逛推特,发现竟然有大神开发了一个建模神器。在像素网格绘制好平面图,再设置下相关参数,就能生成一个3D锤子模型了,妙啊… 其实Windows10系统也有类似的傻瓜式建模软件,叫“画图3D”,它能帮你秒速建…

用计算机3d建模做紫砂壶好吗,3D建模制壶,走在制壶科技的前沿——潘洪强

原标题:3D建模制壶,走在制壶科技的前沿——潘洪强 每一种工艺都有其独特的美,他用艺术的眼光探寻,借助科技缔造出完美的紫砂艺术品。 潘洪强,宜兴紫砂圈的人才。他会做壶,有创意,灵活运用科技的…

扫黑牵出制壶大师,紫砂壶真的那么值钱?

特约作者| 与归 近日,江苏省宜兴市检察院通报了一则消息:该院依法以涉嫌敲诈勒索罪、寻衅滋事罪,对在宜兴市紫砂行业以打假为由,多次采用拘禁、殴打、上门滋扰等手段实施违法犯罪活动的邵洪群、许鹏、吴浩、盛云峰等4名恶势力犯罪…

用手刻出计算机系统,紫砂壶电脑刻字和手工刻字,你看得出吗?

原标题:紫砂壶电脑刻字和手工刻字,你看得出吗? 刻字即用刀在木头或石头上雕刻出文字或者图画,紫砂壶刻字亦是如此,就是在壶壁上雕刻出文字和图画。 “ 紫砂壶陶刻 紫砂壶大体分为光货,花货,筋纹…

最理想的饮茶器具──紫砂壶

饮茶习惯在我国有着悠久的历史,古代文人雅士平时经常聚集一起,且鼎且缶,以啜以饮,视为可获得无穷的情趣。据汉代《华阳国志》,司马相如《凡将篇》和杨雄的《方言》等书中记录了,武王伐纣时就出现将茶作为贡…

基于SSM的紫砂壶交易系统

紫砂壶交易系统采用了jsp的mvc框架,SSM(springMvcspringMybatis))框架进行开发,主要实现了从紫砂壶管理,紫砂壶分类和查询,到紫砂壶车实现,用户订单处理,再到系统管理。基本上实现了网上购物的功能流程,能够实现用户与…

江南情节——紫砂壶品茶

很多人有江南情结,故江南水乡引来八方宾客。人们经常会想起,那一次烟雨痴迷时节,撑一把油纸伞,走过水边小巷,选一处静静的茶楼,掏出随身携带的紫砂壶,此壶经数年泡养,略有小成。 静…

[日推荐] 『紫砂壶平台』一把紫砂,一种品味

最近小编一直想喝茶,但胃不是很好,又不敢喝,想当年小编喝茶是有讲究的啊,只喝人参乌龙茶,杯子只用紫砂杯或紫砂壶。人生境界瞬间提高。 不过小编那时喝茶真的不叫喝茶,叫吃茶~叶!So。。。胃病犯…

走进紫砂老泥料

泥料是紫砂壶中最重要的一关,但现在很多壶友对新、老泥料之说存在误区,所有的紫砂泥料至今都是经历了上千年甚至上亿年的时间,都可称之为老泥料,而我们平时说的老泥料实际上是指陈腐时间较长的泥料,从某种程度上来讲泥…

紫砂壶的起源 计算机操作题,简析紫砂壶筋瓤器的起源与发展

原标题:简析紫砂壶筋瓤器的起源与发展 紫砂壶,因其造型艺术之美,形制之多,文化气息之丰富,被人们称为是一座伟大的艺术宝库。 从形而言,紫砂壶有取材于动物和植物两个内容的造型。动物,过去通常…

紫砂壶的起源 计算机操作题,紫砂壶的起源与历史发展你知道吗?

原标题:紫砂壶的起源与历史发展你知道吗? 紫砂壶始于北宋,1976年,宜兴羊角山紫砂古窑出土,被认为宜兴紫砂源自宋代的依据。宜兴羊角山古窑址调查文稿曾指“上限不早于北宋中期,盛于南宋,下限延至…