1
完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>
标签 > 强化学习
文章:223个 浏览:11245次 帖子:1个
近日,专注于模型赛道的初创企业边塞科技宣布被蚂蚁集团收购。据悉,此次交易完成后,边塞科技将保持独立运营,而原投资人已全部退出。 与此同时,蚂蚁集团近期宣...
谷歌AlphaChip强化学习工具发布,联发科天玑芯片率先采用
近日,谷歌在芯片设计领域取得了重要突破,详细介绍了其用于芯片设计布局的强化学习方法,并将该模型命名为“AlphaChip”。据悉,AlphaChip有望...
NVIDIA Isaac Lab助力银河通用打造灵巧手抓取技能模型
在本案例中,银河通用的团队借助Isaac Lab搭建了具有挑战性的灵巧抓握基准 DexGraspNet,这是一个最近提出的基准套件,专门用于学习可泛化的...
文章指出,全球领导人需要认真思考,未来十年内可能出现的超越人类能力的通用AI系统。尽管各国政府一直在讨论AI风险,并尝试引入初步指导方针,但这与专家们所...
特斯拉自动驾驶团队再受重挫,顶尖工程师Paril Jain离任,高层人事变动
数周内,特斯拉已在各部门实施多轮裁员。此外,还有报道显示部分员工因士气低落而选择离司。种种迹象表明,特斯拉正面临严重的人才流失问题。
微软称,带有38亿参数的phi-3-mini经过3.3万亿token的强化学习,其基础表现已经超过Mixtral 8x7B及GPT-3.5;此外,该模型...
对于英伟达的成功秘诀,黄仁勋毫不掩饰地指出其30余载的历史是围绕科技创新与市场打造而展开。追逐科技进步的同时,也激发了市场需求,这便是英伟达的核心理念—...
瑞士苏黎世联邦理工学院新型四足机器人单腿完成开关门、移动任务
据本周五出版的Popular Science杂志报道,近日瑞士苏黎世联邦理工学院机器人系统实验室的科研团队展示了新研究进展:他们训练了自家的机器狗,让其...
图解大模型RLHF系列之:人人都能看懂的PPO原理与源码解读
回想一下我们对NLP任务做强化学习(RLHF)的目的:我们希望给模型一个prompt,让模型能生成符合人类喜好的response。再回想一下gpt模型做...
人工智能的核心是机器学习技术。机器学习的目的是通过无需人工干预的方式将计算机系统训练得到更好的性能。机器学习可以分为监督学习、无监督学习和强化学习三种不...
武大+上交提出BatGPT:创新性采用双向自回归架构,可预测前后token
此外,BATGPT还采用了强化学习方法,从AI和人类反馈中学习,以进一步提高模型的对齐性能。这些方法的结合可以显著提高BATGPT的生成质量和对齐性能,...
碾压GPT-4!谷歌DeepMind CEO自曝:下一代大模型将与AlphaGo合体
一个是用强化学习击败人类围棋冠军、创造历史的AI系统,一个是目前霸榜几乎所有大模型榜单、一骑绝尘的最强多模态大模型,两个AI一合体,简直要无敌了!
DriveGPT 雪湖·海若的底层模型采用 GPT(Generative Pre-trained Transformer)生成式预训练大模型,与 Cha...
本文介绍了强化学习与智能驾驶决策规划。智能驾驶中的决策规划模块负责将感知模块所得到的环境信息转化成具体的驾驶策略,从而指引车辆安全、稳定的行驶。真实的驾...
他表示,仅给出5个演示,MoDem就能在100K交互步骤中解决具有稀疏奖励和高维动作空间的具有挑战性的视觉运动控制任务,大大优于现有的最先进方法。
就在几年前,能够感知周围环境、识别重要细节——并忽略其余部分——然后利用这些细节来完成任务的技术应用似乎还只是科幻小说中的内容。
说回ChatGPT,例子就不举了,在网上漫山遍野都是,我们主要从技术角度来聊聊。那么,ChatGPT到底是采用了怎样的技术,才能做到如此超凡脱俗的效果?...
编辑推荐厂商产品技术软件/工具OS/语言教程专题
电机控制 | DSP | 氮化镓 | 功率放大器 | ChatGPT | 自动驾驶 | TI | 瑞萨电子 |
BLDC | PLC | 碳化硅 | 二极管 | OpenAI | 元宇宙 | 安森美 | ADI |
无刷电机 | FOC | IGBT | 逆变器 | 文心一言 | 5G | 英飞凌 | 罗姆 |
直流电机 | PID | MOSFET | 传感器 | 人工智能 | 物联网 | NXP | 赛灵思 |
步进电机 | SPWM | 充电桩 | IPM | 机器视觉 | 无人机 | 三菱电机 | ST |
伺服电机 | SVPWM | 光伏发电 | UPS | AR | 智能电网 | 国民技术 | Microchip |
开关电源 | 步进电机 | 无线充电 | LabVIEW | EMC | PLC | OLED | 单片机 |
5G | m2m | DSP | MCU | ASIC | CPU | ROM | DRAM |
NB-IoT | LoRa | Zigbee | NFC | 蓝牙 | RFID | Wi-Fi | SIGFOX |
Type-C | USB | 以太网 | 仿真器 | RISC | RAM | 寄存器 | GPU |
语音识别 | 万用表 | CPLD | 耦合 | 电路仿真 | 电容滤波 | 保护电路 | 看门狗 |
CAN | CSI | DSI | DVI | Ethernet | HDMI | I2C | RS-485 |
SDI | nas | DMA | HomeKit | 阈值电压 | UART | 机器学习 | TensorFlow |
Arduino | BeagleBone | 树莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
OrCAD | Cadence | AutoCAD | 华秋DFM | Keil | MATLAB | MPLAB | Quartus |
C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
DuerOS | Brillo | Windows11 | HarmonyOS |