数据科学家为什要用Git?怎么用?

2023-05-31 0 579

全文:或许你在别的地方听说过Git。或许有人告诉过你,Git只适合应用软件设计者。假如你是统计数据生物学家,所以Git其实对你很关键。责任编辑作者希望能够通过实战经验撷取让你介绍Git的必要性,和怎样在你的统计数据自然科学组织工作中采用它。

甚么是Git?

Git是两个分布式系统版控制技术,用于在应用软件设计前夕追踪源标识符的更动。看看维基得出的那个表述,好像Git专门是为应用软件设计者而设计的。实际上,Git是当今上采用最广泛的现代版控制技术,它是以分布式系统的协同形式为工程项目(开放源码或商业)做出了了不起的贡献。除了分布式系统版控制技术之外,Git的还考虑了性能、可靠性和稳定性。那时你早已介绍了Git是甚么,但是你脑子里的难题可能是,“假如我是做统计数据自然科学工程项目的人,它与我的组织工作有甚么关系?”从前我也一样不能认知Git的必要性,直到我开始在现实组织工作环境中,我才辨认出它时如此关键!

为甚么是Git?

他们来聊聊为甚么?一年前,我决定自学Git。我在Github上撷取并正式发布了我的标识符,这是我在CERN的学术论文工程项目。虽然很难认知Git中常用的名词(git-add、commit、push、pull等),但我知道这在统计数据自然科学应用领域很关键,这使我的数据自然科学组织工作比以往任何人这时候都更为精练。

所以我保持自学状态,并坚持“committing”。当我加入我目前的公司时,我在Git方面的实战经验就派上了大用场,因为Git是跨不同工程项目组展开标识符合作开发和协同的主要形式。更关键的是,当你的组织遵从灵巧应用软件设计架构时,Git尤其管用,在该架构中,Git的分布式系统版控制使整个合作开发组织工作流更为高效率、快速且更易适应变动。所以甚么是版控制呢?版控制是两个系统记录两个文档或几组文件随时间的变动,以便你以后能初始化某一的版。比如,你是两个统计数据生物学家,与两个工程项目组合作,在那个工程项目组中你和另两个统计数据生物学家在构筑机器自学数学模型的这时候,对同两个特点展开组织工作。假如你对该特点做了许多更动并上传至远距存储库,并且这些更动与主组成部分分拆,所以你的工程项目那时变为了1.1版。另一位统计数据生物学家也对版1.1的相同功能展开了许多更动,捷伊更动那时与主组成部分分拆。数学模型就变为1.2版。在任何人这时候,假如你的工程项目组辨认出版1.2在正式发布前夕有许多错误,他们随时能初始化从前的版1.1,这就是版控制的奇妙之处。

做为统计数据生物学家怎样采用Git?

他们早已讨论过甚么是Git及其必要性。那时的难题归因于:做为统计数据生物学家怎样采用Git?做为统计数据生物学家,你不需要成为两个Git应用领域的专家。关键是要认知Git技术的组织工作业务流程和怎样在日常生活组织工作中采用Git。准确地说,我在这里采用的是Git Feature Branch Workflow,它通常被开放源码和商业工程项目采用。假如你想更多地介绍这里采用的名词,

Git Feature Branch Workflow

Feature Branch Workflow像两个中央存储库,master组成部分代表正式的工程项目历史记录。合作开发者每次开始处理两个新特性时,都会创建两个捷伊组成部分,而不是直接提交到他们的本地主组成部分上。捷伊组成部分能(也应该)推送到中央存储库。在这种情况下,能在不修改master组成部分的情况下与其他合作开发者共享两个该组成部分。

在开始执行任何人操作之前,请键入

git remote -v

以确保组织工作区指向要采用的远距存储库。1、从主组成部分开始,创建两个新组成部分

git checkout master git pull git checkout -b branch-name

假如总是维护和更新主组成部分,则切换到本地主组成部分,并将最捷伊提交和标识符提取到本地主组成部分。假设你希望创建两个本地组成部分,向标识符中添加两个新功能,并稍后上传至远距存储库。一旦你将最捷伊标识符更新到本地master组成部分,他们就创建并checkout出两个名为branch-name的新组成部分,所有的更动都将在此本地组成部分上展开。这意味着你本地的master组成部分不会受到任何人影响。

2、更新、添加、提交并将更动推送到远距存储库

git status git add <your-files> git commit -m your message git push -u origin branch-name

上面他们做了很多操作,让他们详细介绍它。一旦发生了许多更新,就将捷伊操作add到本地组成部分,并且希望将该操作上传至远距组成部分,以便分拆到远距主组成部分。git status将输出你对文档的所有更动(追踪或未追踪)。在采用git commit-m“your message”提交消息更动之前,你将采用git add <your files>决定要暂存哪些文档。

在此阶段,你的更动仅显示在本地组成部分中。为了使你的更动显示在BitBucket上的远距组成部分中,你需要采用git push -u origin branch-name命令展开提交。此命令将该组成部分推送到中央存储库,并且-u表示将其添加为远距追踪组成部分。在设置了追踪组成部分之后,能在没有任何人参数的情况下初始化git push,以自动将捷伊功能组成部分推送到BitBucket上的中央存储库。

3、创建pull请求

那时你早已成功地添加了两个新功能并推送到远距组成部分。你为自己的贡献感到骄傲,你希望在将远距组成部分与远距主组成部分分拆之前得到工程项目组成员的反馈。在该组成部分分拆到主组成部分之前,让其他工程项目组成员有机会对其展开审查。你能在BitBucket上创建pull请求。那时,你的工程项目组成员早已查看了你的标识符,并决定在标识符能分拆到主标识符库-master组成部分之前,需要你展开许多其他更动。

git status git add <your-files> git commit -m your message git push

那时,你能按照与之前相同的步骤展开更动、提交并最终将更新推送到中央存储库。一旦采用了git push,你的更新将自动显示在pull请求中。假如其他人已将目标更动为你所接触的同一标识符,则会发生分拆冲突,这在组织工作中很常见。你能在这里看到怎样解决分拆冲突。一旦一切顺利完成,这些功能将会分拆到master组成部分中。

当我第一次开始自学Git时,我感到非常沮丧,因为我仍然没有真正认知工作流。这也是写这篇文章的主要原因之一,它真正分解并在更高层次的认知上向你解释组织工作业务流程。因为我相信,对组织工作业务流程中发生的事情有两个清晰的介绍将使自学过程更为有效。

作者:【方向】

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务