3月22日,中国科学院大连化学物理研究所低碳催化与工程研究部(DNL12)叶茂研究员和刘中民院士团队与华为技术有限公司在前期合作基础上,联合大连理工大学软件学院、榆林中科洁净能源创新研究院等开发了智能化工大模型1.0版本,并在华为“昇思人工智能框架峰会2024”上发布。
智能化工大模型基于华为昇腾人工智能基础软硬件平台开发,可实现化工知识的快速检索及化工流程工艺的自主设计和优化,有望缩短化工工艺流程的研发周期,为实验室成果快速走向工业化提供可能。
化学工业是国民经济重要的基础性行业,产品涵盖衣食住行等领域,但传统范式下化学工业过程新技术研发面临多重挑战。由于缺乏对化工多尺度复杂过程的精确理论描述,新技术研发依赖逐级放大,研发周期往往在十年以上,且耗资高、市场风险大。以大模型为代表的人工智能技术为化工技术开发提供了数据驱动新范式,可改变长期以来我国化工设计领域依赖国外工业软件的状况。研究团队结合中国科学院大连化学物理研究所丰富的化工应用场景和海量的研发数据,开发了智能化工大模型,为推动化工研发新范式建立和化工工业软件国产自主化奠定了重要基础。
研究团队围绕智能化工大模型,开展了一系列工作:开发了化工数据处理平台,可实现用于大模型预训练的多源异构化工数据的高效处理;发展了化工领域知识图谱构建框架,可实现基于大模型的化工领域知识的自动标注和结构化处理。智能化工大模型,不仅可通过交互问答方式实现化工知识的快速准确检索,还初步实现了化工工艺流程自动生成、仿真和反馈优化。研究团队还开发了全流程高通量催化反应机器人试验装置,通过耦合智能化工大模型进行催化反应机理的挖掘,实现了甲醇制丙烯(DMTP)等工艺过程的反应动力学自动生成。
1月26日,上海人工智能实验室(上海AI实验室)开源发布首个科学大模型浦科化学(ChemLLM),拓展了大模型助力科学研究的探索路径。
基于书生·浦语2.0强大的基座模型能力,浦科化学通过注入海量化学专业数据,使大模型获得了理解和处理化学相关专业任务的知识与能力。同时,研究人员发现,随着化学能力的获得,大模型的数理学科及推理能力也得到增强。浦科化学现已开源,并提供免费商用。
根据测试,浦科化学在分子名称转换、分子性质预测和反应产物预测这三项任务上均表现出色,远超过其他同规模模型的水平,并超越了GPT-3.5,证明浦科化学在理解和处理化学知识方面具备强大能力。依托书生·浦语2.0基座模型优秀的多语言能力,浦科化学在经过专业化学知识训练后,还具备了优秀的化学专业中英文翻译能力,可帮助化学研究者跨越语言障碍,准确地翻译化学文献中的专有名词,获取更多的化学知识。在专业化学知识训练之外,浦科化学也进行了初高中知识的学习。在回答初高中化学题目时,不仅能给出答案,还能给出具体的解释。详情:
2023年12月2日,2023国际产学研用合作会议(上海)分子科学与生命健康论坛在华东师大举行。论坛上,华东师大举行了ChemGPT 1.0发布会。
研发团队负责人何晓介绍,ChemGPT 1.0是一个集成了先进人工智能技术的化学合成工具。何晓介绍,ChemGPT 1.0具有三大亮点:第一,高质量化学对话数据集的构建。ChemGPT 1.0整合了超过39万条高质量对线种化学性质问答类数据、11679种科学类(含化学)问答类数据和658种化学类问答类数据以及超过一万条百科词条,转化成了超过207万条问题数据集。基于对化学领域专业知识的广泛收集和深入理解,构建的数据集为全面、准确地完成化学知识问答提供了强大支撑。第二,化合物逆合成数据库的创建。针对化合物逆合成的难题,团队通过数据拼接、叠加、加权和合成方式筛选,构建了一个全新的逆合成数据库。该数据库规模宏大,提高了模型的鲁棒性和反应性,且具有高质量的标注数据,提升了模型的准确性和可靠性。通过更好的数据平衡,显著提高了模型对各类反应的预测能力。在 USPTO-50K测试任务中,经过新数据集训练的大模型ChemGPT达到了74.4%预测精度,位列第一。第三,对话模型和逆合成模型的创新改进。ChemGPT 1.0的对话模型和逆合成模型分别基于ChatGLM模型和LLaMA模型。通过全量微调以及在A800 GPU集群上两个月的训练,性能显著提升。此外,通过多模型多模块融合技术的实施,使得ChemGPT 1.0无需安装任何插件,就能支持化学专业知识、化学逆合成、生物医药以及通用领域的知识问答。此外,ChemGPT 1.0还支持自动上网查资料,帮助模型返回高质量的实时回答并具备绘画功能。更多详情:
杏彩体育app
上一篇:苏州大学李永舫院士团队李耀文教授《EES》:在绿色
下一篇:绿色合作正当时 法企掘金中国循环经济市场