官方接单发单平台上线!有接单发单需求的请直接发布需求,或注册接单!点击此处查看详情!

python机器学习KEGG聚类实验

时间:2023-11-20 浏览:510 分类:Python程序代做

91代做网-专注各种程序代做

包括但不限于:各类毕设课设、作业辅导、代码答疑、报告论文、商业程序开发、论文复现和小程序开发等。

也欢迎各行业程序员加入我们,具体请联系客服详聊:QQ号:,微信号:,接单Q群:

每道题编写程序,保存为一个以.py结尾的文件。最后提交试题的文件是一个文件夹的压缩包,包括4python程序文件,四个输入文件(input_1.fq、input_2.fa、kegg.txt、gene_log2fc.txt)(为了方便理解上述文件均可以表格形式打开观察其形式和内容),三个输出文件(output_1.faoutput_4-up.txtoutput_4-down.txt)。读取文件和写入文件的路径为相对路径,即在提交的文件夹下,文件夹命名为姓名加学号,需将答案打印到屏幕上的题目,答案须在文件中以注释形式(#号)给出。并且代码中不含>>>。示例如下:

第一题:

fq文件转换成fa文件

已知fq.文件有四行,fa.文件有两行,前两行二者相同,则将fq.文件转换成fa.文件的程序是?(输入文件为input_1.fq)(输出文件命名为output_1.fa)

 

第二题:

有多条DNA序列,(输入文件为input_2.fa)完成以下题目。

1. 计算序列长度,并输出最长的序列到屏幕上。

2. 统计序列来自哪些物种,每个物种各有几条序列。

例:Homo sapiens  1条

 

第三题:

有一条DNA序列

GGTCACTAAGGGTGATCGATTACGTATAGTAGAATTCTATCATACATATATATCGATGCGTTCAT

1. DNA序列中C出现多少次,写出此过程程序并将最终结果以注释形式输出到屏幕上。

2. 计算该DNA序列的CG含量,写出此过程程序并将最终结果以注释形式输出到屏幕上。

3. 求该DNA序列对应的mRNA链,写出此过程程序并将最终结果以注释形式输出到屏幕上。

 

第四题:

现有一KEGG聚类结果,读取文件完成以下题目。

1. 找出Count数大于20的通路,并将通路名称打印到屏幕上。

2. 在结果中找出卵巢类固醇生成和雌激素信号通路,并将两个通路富集到的基因取交集,将交集里的基因打印到屏幕上。

3. 在表达量文件gene_log2fc.txt中找到两个通路所包含的全部基因的表达差异倍数,将表达量上调的基因写入一个文件并命名为output_4-up.txt,下调的写入一个文件并命名为output_4-down.txt,文件每一行包含基因ID及其表达差异倍数,格式与输入文件保持一致。


客服