本书从现象出发,深入浅出地介绍深度学习的基本原理,包括神经网络的输出和参数演化规律,以及大语言模型如何逐步涌现出更复杂的推理。本书以呈现现象为主,对读者的理论要求低,但能抓住深度学习的核心原理,对理解和训练深度学习都有重要帮助。

在线购买

当当 京东 亚马逊
作者许志钦 张耀宇
出版社:电子工业出版社
出版时间:2026-03-01
ISBN:9787121522260

许志钦 张耀宇深度学习现象导论:从感知机到大模型

许志钦

2012年本科毕业于上海交通大学致远学院。2016年博士毕业于上海交通大学,获应用数学博士学位。2016年至2019年,在纽约大学阿布扎比分校和柯朗研究所做博士后。2019年至2025年,上海交通大学自然科学研究院/数学科学学院长聘教轨副教授。2025年至今,上海交通大学自然科学研究院/数学科学学院教授。

张耀宇

2012年本科毕业于上海交通大学致远学院。2016年博士毕业于上海交通大学,获应用数学博士学位。2016年至2019年,在纽约大学阿布扎比分校和柯朗研究所做博士后。2019年至2020年,在普林斯顿高等研究院做博士后。2020年至今,上海交通大学自然科学研究院/数学科学学院:长聘教轨副教授。

 

╮(╯_╰)╭还没有文章哦~