-1-
AI小史
1956年夏天,在美国东部达特茅斯,一群计算机科学家在学术会议上,首次将像人那样思考的机器称为人工智能(AI)。就此,AI开始了跌宕起伏的发展历程。因为算法、算力、数据,AI三要素是陆陆续续完善的,使得AI经历了二次低谷和三次浪潮[1]。2023年春天,时至当下,ChatGPT的出现和快速迭代,曾经被反复质疑的AI,终于正名,属于人工智能的“苹果高光时刻”终于来临。DIA中国数字健康社区(DHC),特此邀请到几位行业专家,进行了《数字健康沙龙活动》[2],共话AI过去、现在、未来,旨在帮助生物医药行业的同行们更加从容积极地迎接生物医药新时代。
-2-
AI如何商用?
刘胜利
IBM大中华区数据与人工智能技术总监
在IBM公司长期从事企业级软件相关的技术与服务工作,深耕数据库,大数据平台,人工智能技术,参与过国内多个行业的数字化转型,企业云架构,大数据平台,数据中台,人工智能相关项目,是多种开源技术的爱好者、实践者。
1997年深蓝电脑战胜象棋大师卡斯帕罗夫,人工智能机器人从此亮相在大众面前。接着,搜索引擎的强大逐渐体现在生活方方面面。今年,ChatGPT作为一项重磅科技创新突破,实现了从量变到质变,AI技术开始真正像人脑一样工作,能解析业务上下文,理解具体需求。
那么,ChatGPT作为通用AI,可以使用到商业化环境中么?这是很多商业客户特别想知道的?商业对话机器人与通用对话机器人有哪些不同?IBM刘胜利,围绕这一话题,展开分享。[3]
IBM的Watson智能对话机器人已经在市场上有5年以上的商业应用经验,作为一款成熟的机器人,它采用了大语言模型(LLM)进行了预训练,在多国语言方面表现优异。它具备对话能力来处理FAQ问题和知识搜索能力来处理长尾问题,其背后需要关联强大的知识训练数据库,通过“大样本学习-小样本学习-强化学习”三种训练,使得Watson对自然语言理解能力大为提升,能很好得理解对话的上下文,并具备强大的多轮商业对话能力。
通用ChatGPT,目前在对话并理解需求方面有了巨大提升。然而如创始人Sam Altman所提到[4],和所有测试者感受类似,娱乐玩玩可以,但靠它做决策还存在局限性。而商用AI的用户,要求则非常苛刻,包括但不限于:理解业务、准确且具体、个性化服务、能跨部门、合乎伦理值得信赖、开放与集成兼备产品化、成熟度高且有商业回报。否则,没有人会为商用AI付费。
IBM商用化Watson机器人,在全球新冠肺炎的环境下,医疗资源非常紧张,该智能机器人在多个医院,通过预先培训新冠肺炎(COVID-19)的内容,18小时培训+成功部署。某儿科医院,智能机器人,成功帮助家长预测孩子何时有感染新冠肺炎的风险,并给出建议何时寻求医疗救助。
我们有理由相信,chatGPT 催生了一轮AI应用的热潮,更多的商业用户会采用各种大语言模型来开发各类不同的商业AI应用,以替代大量的人工工作,成为企业的数字员工。这将带动新一轮的科技革命。
-3-
AI如何搭建?
周德标
甲骨文生命科学业务部北亚区总经理
中国国际科技促进会医工结合分会副会长,《亲密接触人工智能》 (电子工业出版社)作者。拥有 20 余年在咨询公司以及研发机构的工作经验。对于大数据以及人工智能 在医药行业的技术创新和应用有着丰富的实践经验。 周德标先生目前担任甲骨文生命科学业务部北亚区总经理。此前历任亚马逊AWS生命科学行业总监;IBM Watson健康事业部首席运营官等职位。他拥有丰富的数字化技术在医疗医药领域的实践经验,指导实施了包括数字化医疗在内的众多行业领先解决方案。在日常工作的同时,周德标先生在 2008 年到 2011 年间在早稻田大学担任教职,目前在中国科学院大学及四川大学开设《人工智能及应用》课程。周德标先生拥有单独申请的专利认证,在国外专业期刊上发表过学术论文。
人工智能如何学习?人工智能的识别和分类是指利用机器学习、深度学习等人工智能技术,对不同的数据进行自动识别和分类。这些数据可以是图像、声音、文本等,人工智能技术可以通过对这些数据的学习和训练,实现自动的分类和识别。[5]
人工智能的识别和分类应用非常广泛,例如:图像识别和分类:通过训练模型,可以实现自动识别和分类图像数据,如医学影像识别等。文本识别和分类:通过训练模型,可以实现自动识别和分类文本数据,如垃圾邮件过滤等。
机器学习和深度学习,有着密切关系但概念不同。其关键区别在于特征提取这一步骤:机器学习是指计算机的算法根据人工定义的特征,从数据中学习规律;而深度学习是将特征提取和规律学习整合在了一起,这一过程通过人工神经网络来实现。深度学习因为能够发现不为人类所知的特征,所以在计算机视觉、自然语言处理等领域大放异彩。
ChatGPT背后的自然语言处理逻辑是什么?自然语言处理的目标是让计算机处理或说“理解”我们人类的语言,以完成有意义的任务,比如问答、聊天等。自然语言处理的难点在于语义理解,而这是因为自然语言具有“表达形式”和“内在逻辑”两种属性,利用深度学习技术提升自然语言处理能力已经是大势所趋。自然语言处理的任务当中,最重要的工作是把文字符号转化为词向量,进而可以通过词向量完成各种自然语言处理的子任务,例如机器翻译,文本匹配,对话机器人等。词向量的训练过程,就是我们现在耳熟能详的所谓“大模型”,例如谷歌的BERT模型、以及OpenAI的GPT所实现的工作。
-4-
AI如何发展?
巨华宁
微软咨询服务资深项目负责人
+18年医疗行业信息系统及CDR实施经验,负责交付过多个大型医疗项目,+12年微软资深项目经理,尤其擅长交付具有一定创新性和前瞻性的项目,专注于项目交付质量和客户价值实现。
最近ChatGPT让OpenAI名声更上一个台阶。OpenAI是一家人工智能研究公司,其建立的目标就是为了与其它机构合作,进行AI的相关研究,并开放研究成果以促进AI技术的发展。OpenAI发布了很多人工智能相关技术,从工具到算法到论文到模型,都有涉及。
OpenAI一款成功产品——GPT,结合了Transformer与无监督的预训练技术,作为OpenAI大语言模型的探索性的先驱。随着不停的迭代,该模式被训练成只要为它提供一小段文字,它就能根据自己的理解来编写余下的内容,小说、新闻,甚至代码都不在话下。
拥有人工智能研究实验室的OpenAI和拥有云服务的微软Microsoft开展了进一步的合作,将在四个方面进行深耕,即:
-
侧重于生成和理解文本的GPT-3
-
侧重于生成并理解代码的Codex
-
侧重于从文本转化为代码的DALL.E
-
侧重于智能对话的Enterprise ChatGPT
最新推出的有AI加持的微软New Bing浏览搜索引擎,用户可以实现二个明显有别于以往的功能:
-
可以利用来自OpenAI的最新模型及功能,非常便捷地提升工作效率;
-
可以从微软云Azure(国内为世纪互联),获得增强的安全、合规和负责的AI模型;[2]
-5-
AI如何影响生物医药行业?
ChatGPT将人工智能革命带上新的高潮。ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。随着ChatGPT的推广,人工智能的应用给生物医药行业的发展提供了——新思路、新挑战、新机会。
本次DIA数字健康沙龙,各位嘉宾和与会听众,围绕生物医药行业,做了深入交流[2]。潜在机会包括如下可能方面:
-
诊断辅助:利用机器学习算法,对大量的病历数据进行分析,辅助医生制定诊断方案;
-
预测分析:利用数据分析和机器学习技术,对病人的病历、生命体征等数据进行分析,预测疾病的发展趋势和治疗效果;
-
药物研发:通过深度学习等技术,对大量的药物分子进行分析和比较,辅助药物研发工作;
-
临床试验:利用新技术,实现数字化招募、电子知情、可穿戴设备、远程医疗、电子患者结局报告、远程监控等等;
-
医院管理:利用人工智能技术,对医院的数据进行分析,优化医院资源的利用,提高医疗效率和质量;
医药人工智能AI的发展,对生物医药行业的革命性影响,正在逐步显现。DIA数字健康沙龙,将持续邀请技术专家和行业大咖,开展更多的互动和交流,共话未来,共商生物医药行业新生存法则。
分享内容仅代表个人观点,不代表所在公司观点。
参考资料:
[1] 公开资料;
[2] DIA 数字健康沙龙3月29日直播;
[3] IBM刘胜利,分享《通用对话ChatGPT vs.商用对话Watson》;
[4] OpenAI Sam Altman,推特发言;
[5] 甲骨文周德标,分享《从零搭建对话机器人》;
[6] 微软巨华宁女士《Microsoft + OpenAI 在行业的探索》;
笔记作者 PROFILE
李蹊
DIA中国数字健康社区志愿者,映恩生物数据管理总监,具有10年左右临床研究领域从业经验,曾就职于赛诺菲,Parexel,Viedoc,科伦等医药企业,有数据管理,数据编程,EDC建库,数据库系统开发等经验,具有南京大学的生物化学和新加坡南洋理工的信息技术双硕士学位,发表过5篇SCI论文。
黎文玉
DIA中国数字健康社区志愿者,阿斯利康医院战略合作经理,具有9年临床研究领域从业经验,曾就职于IQVIA艾昆纬,ICON爱恩康等医药企业,于2021年加入阿斯利康。进入临床研究行业前有10年临床医疗服务相关工作经历。持有项目管理协会(PMI)项目管理专业人士认证(PMP)、产品开发与管理协会(PDMA)产品经理国际资格认证(NPDP)、系统集成项目管理工程师认证。
杨晓栋
DIA中国数字健康社区志愿者,15年曾先后在强生、辉瑞、汤森路透、科睿唯安、IBM等公司机构从事销售、市场、医学推广、临床试验、CRO、供应链、选题立项、战略管线、数字化转型等工作。毕业于重庆大学,获得细胞生物学硕士,同时获得北京大学光华管理学院高级工商管理EMBA学位。
DIA中国数字健康社区(DHC)
DIA中国数字健康社区的使命是提供一个中立的平台,分享和交流有关临床数据工作流程,标准和数字化新技术,并通过应用数字化新技术和推动临床研究中不同环节的数字化最佳实践,以达到提高临床研究质量和效率的目标。
DIA
DIA是一个全球性组织。来自各个领域的生命科学专业人员,在中立的环境中,融合患者、医药研发领域全行业的思想领袖,探讨当今研发的技术问题,提升专业能力以及催化行业共识。作为一个会员驱动的志愿者组织,来自80个国家的专业人士通过平台、教育服务和专业发展机会与DIA合作,促进医药健康产业发展。
DIA总部位于美国华盛顿特区,在美洲(美国宾夕法尼亚州霍舍姆)、欧洲(瑞士巴塞尔)、中东、非洲以及亚洲(中国北京、上海和苏州、印度孟买和日本东京)设有办事处。
dTrial 2023论坛介绍
迎接移动互联网种种革新,置身蓬勃发展的数字赛道和行业风口上,DIA中国数字临床试验创新论坛(dTrial)将数字化技术赋能方式与临床试验高效便捷地结合,以满足患者未满足的需求,注重下沉、落地与实践,最终构建完整的全周期数字化、智能化的高质量临床试验。作为一场医药临床研发数字化的盛会,dTrial今年的内容更加紧扣主题,更加注重落地与实践。4月20-22日三天内,共有研究中心创新、试验模式创新和治疗技术创新三个分论坛。在dTrial 2023,您不仅可以了解最前沿的行业趋势,还有机会与行业精英面对面交流,共同探讨医药临床研发数字化的未来。
关于DIA
DIA是一个全球化、跨学科的国际性学术组织,在中立的环境中,融合医药研发领域全行业的意见领袖,探讨当前研发的技术问题,提升专业能力,以及催化行业共识,在全球医药研发领域享有很高的声誉。