机读格式显示(MARC)
- 000 01128nam0 2200241 450
- 010 __ |a 978-7-121-47531-3 |d CNY118.00
- 100 __ |a 20240821d2024 em y0chiy0110 ea
- 200 1_ |a 视觉问答 |A shi jue wen da |e 理论与实践 |d Visual question answering |e from theory to application |f 吴琦[等]著 |z eng
- 210 __ |a 北京 |c 电子工业出版社 |d 2024
- 215 __ |a 223页 |c 图表 |d 24cm
- 304 __ |a 著者还有:王鹏、王鑫、何晓冬等
- 330 __ |a 本书共5部分,第1部分介绍在计算机视觉和自然语言处理领域广泛使用的基本方法和技术;第2部分将图像视觉问答进一步分为五类,即联合嵌入、注意力机制、记忆网络、组合推理和图神经网络;第3部分讨论基于视频的视觉问答及其相关模型。第4部分讨论与视觉问答相关的高级任务,包括具身视觉问答、医学视觉问答、基于文本的视觉问答等;第5部分对该领域进行总结和展望,讨论视觉问答领域的未来研究方向。
- 510 1_ |a Visual question answering |e from theory to application |z eng
- 606 0_ |a 计算机视觉 |x 图象处理 |j 问题解答
- 690 __ |a TP391.413-44 |v 5
- 701 _0 |a 吴琦 |A wu qi |4 著
- 801 _0 |a CN |b 辽批 |c 20240811