jamesbang

V1

2023/05/20阅读:19主题:雁栖湖

🧐 Excel | 基因名都被Excel篡改了怎么办呢!?~(附3种解决方案)

1写在前面

今天和大家分享一下在做表达矩阵处理时尝尝会遇到的一个问题,但又经常被忽视,就是Excel会修改你的基因名。😷

无数大佬在这里都踩过坑,这些普遍的问题已经被写成了paper左右滑动):👇


问题还是比较严重的,说不定你的目的基因就是这些被改掉名字的基因哦。🤒

我们讲讲怎么处理这些问题吧。🥳

2示例数据

这里我准备了一个excel表格,为被篡改过后的名,大家可以看到都变成了日期。😷

3方法一

这里我们用到一个之前发表过的工具,Escape Excelgithub的地址在这里:👇

https://github.com/pstew/escape_excel


Win的用户可以下载安装插件,Mac的用户可以下载App安装。😗

这里我只介绍一下Mac了哦,这里直接把文件拖进去就可以了,非常简单!~🥳

4方法二

再提供一个在线网站,上传后等待转换即可,也是很方便的,地址在这里:👇

https://kuanrongchan-date-to-gene-converter-date-gene-tool-oodr7h.streamlit.app/


经过简单的操作后,就可以得到正确的Gene name了,自己下载吧!~🥰

5方法三

最后介绍的是使用R包的方式来解决这个问题,HGNChelper。😜

5.1 用到的包

rm(list = ls())
library(tidyverse)
library(HGNChelper)

5.2 读入基因列表

因为这个包只支持人类小鼠的基因转换,这里我们就只建立两个genes列表了哦。😋

human <-  c("FN1", "TP53", "UNKNOWNGENE","7-Sep", "9/7", "1-Mar", "Oct4", "4-Oct",
"OCT4-PG4", "C19ORF71", "C19orf71")
human

mouse <- c("1-Feb", "Pzp", "A2m")
mouse

5.3 转换错误的基因名

1️⃣ 人类基因

checkGeneSymbols(human)

2️⃣ 小鼠基因

checkGeneSymbols(mouse, species="mouse")

6如何引用

1️⃣ Welsh EA, Stewart PA, Kuenzi BM, Eschrich JA. Escape Excel: A tool for preventing gene symbol and accession conversion errors. PLoS One. 2017;12(9):e0185207. Published 2017 Sep 27. doi:10.1371/journal.pone.0185207

2️⃣ Koh CWT, Ooi JSG, Joly GLC, Chan KR. Gene Updater: a web tool that autocorrects and updates for Excel misidentified gene names. Sci Rep. 2022;12(1):12743. Published 2022 Jul 26. doi:10.1038/s41598-022-17104-3

3️⃣ Oh S, Abdelnabi J, Al-Dulaimi R et al. HGNChelper: identification and correction of invalid gene symbols for human and mouse [version 1; peer review: 2 approved, 1 approved with reservations]. F1000Research 2020, 9:1493 (https://doi.org/10.12688/f1000research.28033.1)


最后祝大家早日不卷!~

点个在看吧各位~ ✐.ɴɪᴄᴇ ᴅᴀʏ 〰

📍 往期精彩

📍 🤣 chatPDF | 别再自己读文献了!让chatGPT来帮你读吧!~
📍 🤩 WGCNA | 值得你深入学习的生信分析方法!~
📍 🤩 ComplexHeatmap | 颜狗写的高颜值热图代码!
📍 🤥 ComplexHeatmap | 你的热图注释还挤在一起看不清吗!?
📍 🤨 Google | 谷歌翻译崩了我们怎么办!?(附完美解决方案)
📍 🤩 scRNA-seq | 吐血整理的单细胞入门教程
📍 🤣 NetworkD3 | 让我们一起画个动态的桑基图吧~
📍 🤩 RColorBrewer | 再多的配色也能轻松搞定!~
📍 🧐 rms | 批量完成你的线性回归
📍 🤩 CMplot | 完美复刻Nature上的曼哈顿图
📍 🤠 Network | 高颜值动态网络可视化工具
📍 🤗 boxjitter | 完美复刻Nature上的高颜值统计图
📍 🤫 linkET | 完美解决ggcor安装失败方案(附教程)
📍 ......

分类:

后端

标签:

后端

作者介绍

jamesbang
V1

wx🔍: Grassssss 卷起来了