Gao Lab测试-2024 发表于2024年5月13日2024年6月26日 SPAN> 由yangdc SPAN> 本测试的目的是帮助你检查在实验室进行生物信息学研究与学习所需的基础知识与基本技能,你应该在自己开始答题后24小时之内独立完成测试,超过24小时的提交将无效,最晚提交时间不晚于6月25日晚18点。 其间,你可以: 自行通过网络查找资料,独立完成; 由于本测试为题库随机抽题,答题期间请勿关闭网页,再次进入题目由于设备原因有概率会重新抽取。 多次尝试,最终分数以最后一次提交为准。 你不能: 抄袭; 剽窃。 本试题共计20道题,包含选择、填空、问答题,选择题均为不定项选择题。为了保证题目的有效性和公平性,请勿转发和分享。 姓名 Email 手机 Access Code 1. 请自行在NCBI上搜索相关信息,然后判断以下哪些说法是错误的: A. Linc2GO算法的主要目的是根据竞争性内源RNA的机制推测microRNA和lincRNA的功能 B. lncRNA-MFDL是基于深度学习预测lncRNA具体行使的生物学功能的 C. 目前基于 CRISPRi 方法测定lncRNA功能的研究里,暂时还没有涉及到lncRNA在干细胞中的功能 D. 目前用在lncRNA领域的深度学习模型里,没有模型同时整合了CNN(卷积神经网络)和RNN(循环神经网络) 2. 以下关于两个随机变量观测值的哪些说法是错误的: A. 如果Pearson相关性为零,代表它们相互独立 B. 如果Spearman相关性为零,代表它们相互独立 C. 如果互信息为零,代表它们相互独立 D. 如果KL散度为零,代表它们相互独立 3. 以下关于Transformer的叙述,正确的有: A. Transformer里decoder不需要encoder的输入 B. Transformer在训练时需要同时输入原始数据和标签数据 C. Transformer的Encoder和decoder结构相同 D. Transformer的输入需要加入序列位置信息 4. 选择以下所有正确说法: A. 基于亚硫酸氢盐转化的DNA甲基化测序不能检测C到T的SNP B. 细胞游离DNA(cell-free DNA)中的DNA甲基化信息可用于预测癌症种类 C. DNA甲基化只会明显抑制转录因子对DNA的结合,不会增强结合 D. 三代测序鉴定DNA甲基化不需要做亚硫酸氢盐转化 5. 现有如下p值:0.001, 0.003, 0.006, 0.01, 0.02, 0.15, 0.25, 0.46, 0.68, 0.79。第1个p值使用Bonferroni correction 后的数值是: A. 0.0001 B. 0.01 C. 0.05 D. 以上均不对 6. 以下对于基因敲除/敲低技术描述错误的是: A. CRISPR比RNAi的主要优势在于脱靶率低。 B. CRISPRi的基因敲低效率在不同基因上差异较大,这主要来自于不同基因的启动子性质差异。 C. 在对持家基因的研究上,敲低比敲除更具有优势,因为这些基因的完全敲除会导致细胞死亡。 D. 用Cas9对基因片段进行删除可以达到单核苷酸精度。 7. 在人类基因组,chr5:40490609-40490609(hg19)的位置上有C>T的突变, 在dbSNP build 150的版本中,该突变的ID为:%BLANK% 8. A. O(n) B. O(n*log(n)) C. O(n^2) D. O(n^3) 9. 以下关于单细胞组学实验技术的说法错误的有: A. 10x Visium技术可以检测单细胞在组织中的完整空间邻域 B. 10x Xenium技术可以检测单细胞在组织中的完整空间邻域 C. Perturb-Seq技术可以⼤规模鉴定基因间的直接调控作⽤ D. scNOMe-seq可以在单细胞中同时检测三种组学模态 10. (可以在word中编辑完成后复制过来,亦可拍照发送到我们的邮箱) 11. 以下哪些空间转录组方法可以检测单细胞边界(Cell Segmentation): A. Slide-seq B. MERFISH C. FISSEQ D. seqFISH 12. 在结构因果模型(SCM, Structural Causal Model)中,以下哪些说法是错误的? A. 结构⽅程总可以写成x = f(Pa(x)) + ϵ的形式 B. 结构⽅程中等号的含义具有不对称性,右边与左边分别代表因与果 C. 结构⽅程只要满⾜⽆环⼀定有唯⼀解 D. 结构⽅程必须满⾜⽆环才有唯⼀解 13. 假设你处在⼀个名为"feature"的git分⽀,它基于"main"分⽀,且在分⽀之后"main"分⽀上也发⽣了其他修改。现在,你想将"feature"分⽀上的更改重新应⽤到现在的"main"分⽀上,应该使⽤以下哪个命令来完成这⼀操作? A. git merge feature B. git merge main C. git rebase feature D. git rebase main 14. 以下哪些降维/可视化方法是线性的: A. PCA B. UMAP C. tSNE D. NMF 15. 特征选择是对于冗余特征较多的数据集的一种重要方法。下面有关描述正确的有: A. 基于Lasso的特征选择方法的原理是使用了L2范数对数据进行稀疏化 B. 封装式(Wrapper)特征选择方法会基于分类器的分类性能进行特征选择 C. 基于信息增益准则进行特征选择主要原理是判断加入该特征后信息熵变化大小 D. SVM可以用作特征选择,比如可以使用支持向量数目与训练样本数目的比值作为评价函数进行特征选择 16. 哪些命令本身(不使用管道)可以用于清空一个文件夹下所有内容? A. rsync B. rm C. ls D. pwd 17. RNA可以通过竞争性内源 RNA (ceRNA)机制发挥抑制其他RNA表达的作用,如图所示,关于lncRNA-miRNA-mRNA三者形成的crosstalk,说法不正确的是: A. miRNA可以同时抑制lncRNA和mRNA的表达量 B. 增加lncRNA的表达量可以降低mRNA的表达量 C. 突变mRNA上miRNA的靶位点可以降低lncRNA的表达量 D. 降低mRNA的表达量可以增加lncRNA的表达量 18. 以下哪些组学技术现在可以做到单细胞精度: A. transcriptomics B. methylome C. 3d genome D. Proteomics 19. 存在样本:samplenames = [“1”,”2”,”3”…”100”], 各样本的权重为weights = [1,2,3,..100], 请自己设计算法,并给出代码或伪代码,对这100个样本按权重无放回抽样,随机抽取50个样本(请勿直接调用带权抽样函数)。 20. 基因突变有多种类型,请问下图展示的是什么类型的突变: A. 错义突变 B. 无义突变 C. 同义突变 D. 终止密码子突变 可将你的想法/意见与建议写在下面 谢谢填写! 请确认后,按下方按钮提交答案。 Time's up