智能工控
智能开发
数据结构与算法
数据分析
机器学习
大模型
编程开发
后端开发
前端开发
移动开发
数据库
学习课程
下载
牛翰社区
发布
发布文章
创建话题
创建圈子
发布帖子
开通会员
开通黄金会员
全站资源折扣购买
部分内容免费阅读
一对一技术指导
VIP用户专属QQ群
开通黄金会员
开通钻石会员
全站资源折扣购买
部分内容免费阅读
一对一技术指导
VIP用户专属QQ群
开通钻石会员
登录
注册
智能工控
智能开发
数据结构与算法
数据分析
机器学习
大模型
编程开发
后端开发
前端开发
移动开发
数据库
学习课程
下载
牛翰社区
开通会员 尊享会员权益
登录
注册
找回密码
87
14
更多资料
搜索内容
啊哈哈哈哈312
关注
私信
文章
1
收藏
0
评论
0
圈子
0
帖子
2
粉丝
0
发布
2
排序
最新发布
最近更新
最新回复
最多查看
最高评分
最多回复
最多收藏
啊哈哈哈哈312
4个月前更新
29次阅读
关注
私信
SELF-REFINE: Iterative Refinement with Self-Feedback
1. 概述
基于给定的Prompt,大语言模型生成的Reponse可能不是最好的(这一点我认为当前的LLM大部分都是Decoder架构,基于已生成...
+2
网络通信
评分
回复
分享
啊哈哈哈哈312
4个月前更新
6次阅读
关注
私信
Unleashing Reasoning Capability of LLMs via Scalable Question Synthesis from Scratch
1. 概述
LLM的SFT数据合成工作不可避免的可以划分为多个阶段: 指令合成 响应合成 数据筛选。
本篇文章采用了传统LLM的训练过程...
+11
智能开发
评分
回复
分享
发布文章
创建话题
创建圈子
发布帖子
在手机上浏览此页面
登录
没有账号?立即注册
用户名或邮箱
登录密码
记住登录
找回密码
登录
注册
已有账号,立即登录
设置用户名
设置密码
重复密码
注册