前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >人鼠基因转换之首字母大写

人鼠基因转换之首字母大写

作者头像
生信技能树
发布2021-02-03 15:57:49
1.1K0
发布2021-02-03 15:57:49
举报
文章被收录于专栏:生信技能树生信技能树

很久以前我在《生信技能树》分享过教程,如果你处理的是小鼠的基因芯片表达矩阵,最后做gsea等分析要对生物学数据库注释,发现绝大部分数据库都是人类的基因名字,有一个取巧的方法是把基因名字修改一下,如下所示:

代码语言:javascript
复制
[1] "PTPRC" "EPCAM" "MME"   "CD3G"  "CD3E"  "CD68"  "CD79A"
[1] "Ptprc" "Epcam" "Mme"   "Cd3g"  "Cd3e"  "Cd68"  "Cd79a"

居然有些人就开始指责我的教程,说这样误导大家了,不同物种的基因对应关系是有相应的同源基因数据库的,不能仅仅是把基因名字修改。让我很无语,难道我不知道可以严谨一点吗?

回归教程本身,人鼠基因转换之首字母大写在R语言的师兄,本着不想自己去造轮子的心态,搜索了一下:

代码语言:javascript
复制
https://stackoverflow.com/questions/6364783/capitalize-the-first-letter-of-both-words-in-a-two-word-string

发现了好多解决方案

后来我采用了 stringr 包的 str_to_title函数:

代码语言:javascript
复制
library(stringr)
genes_to_check = c("PTPRC","EPCAM", 'MME',"CD3G","CD3E", "CD68", "CD79A")
genes_to_check
genes_to_check=str_to_title(genes_to_check)
genes_to_check

大家也可以选择Hmisc包的capitalize函数,代码如下:

library(Hmisc)

代码语言:javascript
复制
genes_to_check = c("PTPRC","EPCAM", 'MME',"CD3G","CD3E", "CD68", "CD79A")
genes_to_check
capitalize(tolower(genes_to_check))

解决方案实在是太多了:The package BBmisc now contains the function capitalizeStrings.

甚至可以自己造轮子,那就是作为一个学徒作业!

使用R语言基础函数,自己创造一个人鼠基因名字转换工具!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-01-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档