机读格式显示(MARC)
- 000 01714nam0 2200277 450
- 010 __ |a 978-7-121-47531-3 |d CNY118.00
- 100 __ |a 20240914d2024 em y0chiy0110 ea
- 200 1_ |a 视觉问答 |A shi jue wen da |e 理论与实践 |d Visual question answering |e from theory to application |f 吴琦[等]著 |g 王鑫,聂婕,朱文武译 |z eng
- 210 __ |a 北京 |c 电子工业出版社 |d 2024
- 215 __ |a 17,223页 |c 图 |d 24cm
- 304 __ |a 著者还有:王鹏、王鑫、何晓冬、朱文武
- 306 __ |a 本书中文简体版专有版权由Springer Nature Singapore Pte Ltd.授予电子工业出版社
- 314 __ |a 吴琦,阿德莱德大学副教授,澳大利亚机器学习研究中心视觉和语言实验室主任,2019-2021年获得ARC Discovery DECRA Fellowship。王鹏,西北工业大学教授、博士生导师,教育部长江学者。2000-2011年在北京航空航天大学自动化科学与电气工程学院学习并获得学士和博士学位。王鑫,清华大学计算机系副研究员,国家优秀青年科学基金获得者。在浙江大学计算机科学与技术学院获得学士、博士学位,在加拿大西蒙弗雷泽大学获得计算科学博士学位。
- 330 __ |a 本书共5部分。第1部分介绍在计算机视觉和自然语言处理领域广泛使用的基本方法和技术;第2部分将图像视觉问答进一步分为五类,即联合嵌入、注意力机制、记忆网络、组合推理和图神经网络;第3部分讨论基于视频的视觉问答及其相关模型;第4部分讨论与视觉问答相关的高级任务,包括具身视觉问答、医学视觉问答、基于文本的视觉问答等;第5部分对该领域进行总结和展望,讨论视觉问答领域的未来研究方向。
- 510 1_ |a Visual question answering |e from theory to application |z eng
- 606 0_ |a 计算机视觉 |x 图象处理 |x 基本知识
- 701 _0 |a 吴琦 |A wu qi |4 著
- 701 _0 |a 王鹏 |A wang peng |4 著
- 701 _0 |a 王鑫 |A wang xin |4 著
- 702 _0 |a 聂婕 |A nie jie |4 译