本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正
(1)作者背景权威:内容理解领域的资深专家,多位国内外高校博士,技术专家骨干。
(2)团队经验丰富:作者团队在内容理解和生成领域工作了10余年,获得了十几个技术大奖和业务大奖,也在内容领域有丰富的经验。
(3)实践经验:全书以工业界丰富的内容算法成果为支撑,全面讲解了企业在内容理解、内容生成、内容质量3大业务场景中的工程经验和案例。
(4)行业先进成果:不仅有互联网的优秀技术和实践,而且还融合了全球技术界在内容理解与生成领域的先进思想和成果。
(5)大模型多模态:一本书讲透文本、图片、音频、视频等各种模态的理解和生成,掌握大模型时代的关键技术。
这是一本在AI大模型技术背景下深入讲解内容理解的技术原理、算法实现与业务实践的著作,由腾讯的高级总监和资深内容专家领衔撰写,全面融入了工业界在内容业务方面积累的先进技术和成熟经验。
全书围绕内容理解、内容生成、内容质量3大关键领域展开,从内容产业的发展趋势与挑战到各种技术和算法,从行业的先进的研究成果到各种典型的应用案例,应有尽有。
第一部分 内容理解(第1~7章)
首先,详细介绍了内容理解的各个模块,包括文本、图像、语音等单模态内容的理解以及多场景文本、视频等多模态内容的理解,帮助读者全面了解内容理解的核心概念、技术细节和研究进展。接着,讲解了多模态学习在内容理解中的应用、多模态内容理解的理论框架和大规模预训练技术。最后,介绍了两个主流的内容理解框架,并结合一个自研的多模态内容理解框架,阐述了解决内容理解问题的流程和具体方案。
第二部分 内容生成(第8~11章)
详细讲解了内容生成的技术细节,结合作者团队在业务实践中探索的应用案例,从图片生成、文本生成、AI素材合成到AI创作,介绍了内容创作的全栈技术,能帮助读者由浅入深地理解内容生成的技术原理与业务实践。
第三部分 内容质量(第12~14章)
详细讲解了信息流产品常见的内容质量问题,比如标题党、假新闻、低俗图片等,介绍了如何对这些与内容质量相关的业务场景进行拆解和定义,将抽象的业务场景转化为可以建模的问题。此外,还介绍了作者团队采用的业务建模流程以及业界常用的解决方案和研究进展。
孙子荀
内容理解与生成领域的资深专家,腾讯高级总监和专家研究员,负责腾讯游戏用户增长与内容生态技术相关的工作。
2012年加入腾讯,十多年来一直从事内容理解、内容生成以及数据科学技术的研究和落地工作,带领团队获得十几项公司级业务奖和技术奖。在内容生态增长、创意营销等领域有丰富的落地经验。带领团队从0到1构建了首*内容技术中台;打造了腾讯游戏全域营销科学体系,帮助多个业务实现降本增效。
与团队一起在人工智能顶级学术会议上发表了多篇论文和报告,在相关领域拥有几十项发明专利。
近年来,信息流产品发展迅猛,人工智能在内容创作、审核、推荐等场景中发挥着重要作用。本书详细介绍了内容理解、内容生成、内容质量三方面的内容,将理论和实践相结合,为内容算法领域的从业者提供了技术方案和应用案例的参考。
——李洪波 极智嘉联合创始人兼CTO/多智能体机器人系统专家
AIGC技术日新月异,开源社区生态繁荣,各互联网大厂纷纷入局,为内容理解、内容生成和应用开创了新的范式。本书比较系统地阐述了文本、图像、语音、视频各模态内容的技术演进和场景应用,值得内容领域的研发人员学习和参考。
——霍承富 淘天集团1688事业部CTO
这本书以企业实践经验为基础,探讨了内容产业中的关键领域——内容理解、内容生成和内容质量。它提供了全面的实践指南,无论对于从业者,还是对于对内容产业感兴趣的读者,都是一本优秀的参考书。相信读者能够从本书中获得启发和帮助。
——熊辉 香港科技大学(广州)协理副校长兼人工智能学域主任/AAAS Fellow/
IEEE Fellow/ACM杰出科学家
这本书深入探讨了内容理解、内容生成和内容质量的核心技术,并详细解析了多模态技术在内容产业中的关键应用。本书特别注重融合视觉、语音、文本等多元领域的知识和信息,为读者提供了一份实践指南。相信读者可以从本书中获得灵感,并将其应用到实际工作中。
——张娟娟 MIT(麻省理工学院)市场学终身教授兼斯隆管理学院全球项目教务主席
本书是一位跳跃于理论与实践之间的优秀“舞者”,将技术与业务场景巧妙结合,为我们揭示了AI在内容产业中的魔力。本书知识点全面,为渴望深入探索内容技术的读者提供了珍贵的导航图。不仅如此,它更是一个窗口,让我们一窥工业界的先进实践与思考。
——何盛烽 新加坡管理大学计算机学院副教授/IEEE Senior Member/CCF Senior Member