- 题名/责任者:
- 视觉问答:理论与实践/吴琦 ... [等] 著 王鑫, 聂婕, 朱文武译
- 出版发行项:
- 北京:电子工业出版社,2024.07
- ISBN及定价:
- 978-7-121-47531-3/CNY118.00
- 载体形态项:
- XVII, 223页:图 (部分彩图);24cm
- 个人责任者:
- 吴琦 著
- 个人次要责任者:
- 王鑫 译
- 个人次要责任者:
- 聂婕 译
- 个人次要责任者:
- 朱文武 译
- 学科主题:
- 计算机视觉-图象处理-基本知识
- 中图法分类号:
- TP391.413
- 一般附注:
- 博文视点
- 题名责任附注:
- 题名页题其余责任者: 王鹏, 王鑫, 何晓冬, 朱文武
- 出版发行附注:
- 由Springer Nature Singapore Pte Ltd.授权出版
- 责任者附注:
- 吴琦, 阿德莱德大学副教授, 澳大利亚机器学习研究中心视觉和语言实验室主任, 2019-2021年获得ARCDiscovery DECRA Fellowship。2019年被澳大利亚科学院授予罗素奖。2015年获得英国巴斯大学计算机科学博士学位, 2011年获得硕士学位。他的研究兴趣主要是计算机视觉、自然语言处理和机器学习。目前, 他正在研究视觉语言问题, 主要是图像描述、视觉问答 (VQA) 以及视觉语言导航方面。在TPAMI、CVPR、ICCV、ECCV等著名会议和期刊上发表论文100余篇。他还是CVPR、ICCV和NeurlPS会议的领域主席。
- 书目附注:
- 有书目
- 提要文摘附注:
- 本书共5部分, 第1部分介绍在计算机视觉和自然语言处理领域广泛使用的基本方法和技术, 包括卷积神经网络、序列建模和注意力机制等。本书将视觉问答分为图像和视频方法。第2部分将图像视觉问答进一步分为5类, 即联合嵌入、注意力机制、记忆网络、组合推理和图神经网络。此外, 概述基于图像的其他视觉问答任务, 例如基于知识的视觉问答、视觉问答的视觉和语言预训练。第3部分讨论基于视频的视觉问答及其相关模型。第4部分讨论与视觉问答相关的高级任务, 包括具身视觉问答、医学视觉问答、基于文本的视觉问答、视觉问题生成、视觉对话和指代表达理解, 它们是视觉问答任务的扩展。第5部分对该领域进行总结与展望, 讨论视觉问答领域的未来研究方向。
全部MARC细节信息>>
索书号 | 条码号 | 年卷期 | 校区—馆藏地 | 书刊状态 | 还书位置 |
TP391.413/472 | S4020760 | 总馆—滁州校区自然书库 | 可借 | 滁州校区自然书库 | |
TP391.413/472 | S4020761 | 总馆—滁州校区自然书库 | 可借 | 滁州校区自然书库 | |
TP391.413/472 | S4036981 | 总馆—工业技术书库(龙湖) | 可借 | 工业技术书库(龙湖) | |
TP391.413/472 | S4036982 | 总馆—工业技术书库(龙湖) | 可借 | 工业技术书库(龙湖) | |
TP391.413/472 | S3998014 | 总馆—自然书库(凤阳) | 可借 | 自然书库(凤阳) | |
TP391.413/472 | S3998015 | 总馆—自然书库(凤阳) | 可借 | 自然书库(凤阳) |
显示全部馆藏信息