本书从现象出发,深入浅出地介绍深度学习的基本原理,包括神经网络的输出和参数演化规律,以及大语言模型如何逐步涌现出更复杂的推理。本书以呈现现象为主,对读者的理论要求低,但能抓住深度学习的核心原理,对理解和训练深度学习都有重要帮助。
许志钦 张耀宇(深度学习现象导论:从感知机到大模型)
许志钦
2012年本科毕业于上海交通大学致远学院。2016年博士毕业于上海交通大学,获应用数学博士学位。2016年至2019年,在纽约大学阿布扎比分校和柯朗研究所做博士后。2019年至2025年,上海交通大学自然科学研究院/数学科学学院长聘教轨副教授。2025年至今,上海交通大学自然科学研究院/数学科学学院教授。
张耀宇
2012年本科毕业于上海交通大学致远学院。2016年博士毕业于上海交通大学,获应用数学博士学位。2016年至2019年,在纽约大学阿布扎比分校和柯朗研究所做博士后。2019年至2020年,在普林斯顿高等研究院做博士后。2020年至今,上海交通大学自然科学研究院/数学科学学院:长聘教轨副教授。