GPT-4o 提供的全双工语音对话带来了一股研究热潮,目前诸多工作开始研究如何利用 LLM 来实现端....
背景介绍 本文是基于我们之前的 RPN(Reconciled Polynomial Network)....
在 AI 领域,近期的新闻焦点无疑是关于「Scaling Law 是否撞墙?」的辩论。这一曾经被视作....
随着扩散生成模型的发展,人工智能步入了属于 AIGC 的新纪元。扩散生成模型可以对初始高斯噪声进行逐....
本文简要介绍了经典图神经网络(GNNs)的基准分析研究,发表在 NeurIPS 2024。 文章回顾....
大模型应用开卷,连一向保守的苹果,都已释放出发展端侧大模型的信号。 问题是,大语言模型(LLM)卓越....
可迁移的推荐系统 (TransRec) 通常包含一个用户编码器和一个或多个基于模态的物品编码器,其中....
用大模型解决困扰数学家60多年的问题,谷歌DeepMind最新成果再登 Nature。 作者之一、谷....
想将一份文档图片转换成 Markdown 格式?以往这一任务需要文本识别、布局检测和排序、公式表格处....
在这篇 NeurIPS23 论文中,来自鲁汶大学、新加坡国立大学和中科院自动化所的研究者提出了一种视....
这篇是 ICLR 上用 TCN 来做一般的时间序列分析的论文,在 Rebuttal 之后的分数为 8....
除了模仿人类说话、写作、写代码,大模型还能用来发现新知识。 作为今年 AI 圈的顶流,大型语言模型(....
机器学习模型依赖于批处理(Batching)来提高推断吞吐量,尤其是对于 ResNet 和 Dens....
由于本文以大语言模型 RLHF 的 PPO 算法为主,所以希望你在阅读前先弄明白大语言模型 RLHF....
从理论分析入手把握大规模神经网络优化的规律,可以指导实践中的超参数选择。反过来,实践中的超参数选择也....
正是包括两位菲尔兹奖获得者在内四位数学家的坚持,才得以证明了一个堪称「加性组合学圣杯」的猜想,其中 ....
2023年11月18日CCF YOCSEF太原在太原理工大学明向校区信计学院北楼一层会议室举办“卫星....
研究者表示,CoDi-2 标志着在开发全面的多模态基础模型领域取得了重大突破。 今年 5 月,北卡罗....
论文链接: https://arxiv.org/abs/2305.10299 代码链接1: htt....
AI Agents 是当下大模型领域备受关注的话题,用户可以引入多个扮演不同角色的 LLM Agen....
本文介绍了一项近似注意力机制新研究,耶鲁大学、谷歌研究院等机构提出了 HyperAttention,....
你的测试集信息在训练集中泄漏了吗? 一个参数量为 13B 的模型竟然打败了顶流 GPT-4?就像下图....
作为本年度人工智能领域最重要的突破之一,大语言模型相关研究始终是各大相关领域的关注焦点。 近日,来自....
如果想让机器人帮助你,你通常需要下达一个较为精准的指令,但指令在实际中的实现效果不一定理想。如果考虑....
网友:我都不敢想 象一年后的视频技术会有多先进。 一段五十秒的预告视频,再次让 AI 圈沸腾了。 昨....
Paper List: https://github.com/westlake-repl/Reco....
Transformer 在时间序列预测中出现了强大能力,可以描述成对依赖关系和提取序 列中的多层次表....
上海交大上海AI Lab发布178页GPT-4V医疗案例测评,首次全面揭秘GPT-4V医疗领域视觉性....
论文链接: https://arxiv.org/abs/2305.17476 代码链接: https....
离开学校加入公司的业务部门已经半年多了,往后应该会努力抽时间做点开源项目,但暂时没什么计划再发一作论....