为了解AI发展两条线的关系以及大模型的发展历程。三亚学院于2023年12月23日9:15在三亚学院书山馆大报告厅进行特邀报告,主题是“大模型的前世与今生”。本场讲座由清华大学教授孙富春教授进行主持。
在人工智能领域,大模型是指拥有超过10亿个参数的深度神经网络,孙富春教授通过解说AI发展的行为路线及如何使机器人同人一样思考两条线路说明大模型发展最早时期是神经科学的发展。
视觉是人类获得外部信息的重要手段,孙富春教授引用1958年猫初级视皮层立体视觉神经机制的研究,指出视觉皮层的神经元有一个小的局部接受视野,这就意味着它们只对视野的局部内的视觉刺激做出反应。这种强大的组织结构可以检测到视觉区域内的所有复杂模式。这些关于视觉皮层的研究影响了1980年引入的新认知机,然后逐步演变成现在所说的卷积神经网络。
随着计算机硬件性能的不断提升和深度学习算法的不断优化,大模型的发展也越来越快速。一系列的大模型相继问世,如OpenAI的GPT,它们的参数规模不断扩大,训练时间也越来越长,但是性能也随之提升。现在,大模型已经成为人工智能领域的重要研究方向之一。
大模型已经成为人工智能领域的热点话题,受到了广泛的关注。孙富春教授通过深度剖析大模型的前世与今生,为人工智能领域的未来研究提供了重要的思路和指导。在回顾大模型的历史同时,孙富春教授也深入分析了其在当今社会和科技环境中的演变,研究者在追求模型性能的同时,要保持对伦理和社会责任的高度警觉。