【AiBase提要:】摩根大通推出多模态文档理解模型DocLLM
知名AI学者吴恩达在其创办的AI教育科技公司DeepLearning.AI官网发表了一篇预测AI趋势的新文章。他相信AI领域有三件事在未来十年都不会改变:
因为公开信中的措辞,遭到更大范围吐槽的花西子连登热搜。此后,不论是直播间送眉笔还是微博在线“发疯”,亦或强硬输出品牌愿景、解释价格质疑,都没能缓解花西子的糟糕处境。
CogAgent还提供了可视化代理的能力,能够返回任何给定任务的计划、下一步行动和带有坐标的具体操作。它还增强了与图形用户界面相关的问题解答功能,可以处理与网页、PC应用程序、移动应用程序等任何图形用户界面截图相关的问题。另外,通过改进预培训和微调,CogAgent还增强了OCR相关任务的能力。这些功能的提升使得CogAgent在多个基准测试上实现了最先进的通用性能。