清华KEG实验室近来和智谱AI协作,联合推出了新一代图画了解大模型CogAgent。
该模型根据此前推出的CogVLM,经过视觉GUI Agent,运用视觉模态(而非文本)对GUI界面进行更全面直接的感知,然后作出规划和决议计划。
例如,用户输入一张关于CogVLM项目的GitHub的图片,然后问询怎么给这个项目点“Star”,然后CogAgent就会反应出成果。
例如用户输入一张原神游戏的截图,能够问询“当前任务中的队友是谁?”,CogAgent会给出相关的答复。
上一篇:平板闸阀的特色及运用
下一篇:电气一次识图根底
电 话 : 022-86927931
手 机:18502628839
邮 箱: Mr.ye@crdvalve.com
地 址:天津市津南区小站工业区荣盛路1号
网 址:www.hbhzdq.com