立即注册  找回密码
 立即注册
CeraNetworksBGVM服务器主机交流会员请立即修改密码Sharktech防护
查看: 44|回复: 5

有做tg聊天记录采集并投喂给大模型的开源项目不?

[复制链接]

有做tg聊天记录采集并投喂给大模型的开源项目不?

[复制链接]

241

主题

315

回帖

2193

积分

金牌会员

积分
2193
xchiminer

241

主题

315

回帖

2193

积分

金牌会员

积分
2193
2024-12-24 17:41:07 | 显示全部楼层 |阅读模式
主要痛点是:

1.不想群聊,9成废话,但不到0.1成的信息又超级有用。减少走弯路。
总结:有用信息的获取成本高昂,与时间正相关。特别一天1w+讨论的群组。

2.采集信息,投喂给比如LLAMA3,训练他给出日报,周报,月报。合并同类项,权重,时间推移,关联度等。
总结:这样可以列表,将主题做缩进查看。权重来置顶相关话题。过滤垃圾主题。比如N26开户,通过时间过滤,可以查看到最新政策和坑点。

3.标记大神,让ai来判断人品。
总结:平时因为一个网友发了一个很有用的信息,但对此人没有太多背调,所以贸然接触可能会上当受骗。让ai自动对他的发言进行采集,从对话进行性格推断,增加可信度辨识率。

大体是这样,当然后面还想有一些完善的,不知道有没有轮子,没有就先记录记录了。
回复

使用道具 举报

90

主题

192

回帖

1206

积分

金牌会员

积分
1206
callmefeifei

90

主题

192

回帖

1206

积分

金牌会员

积分
1206
2024-12-24 17:49:59 | 显示全部楼层
某研究所已经做了
回复

使用道具 举报

150

主题

213

回帖

2130

积分

金牌会员

积分
2130
rrw

150

主题

213

回帖

2130

积分

金牌会员

积分
2130
2024-12-24 17:54:48 | 显示全部楼层
。。。 是不是把ai 想的 过于ai 了
回复

使用道具 举报

241

主题

315

回帖

2193

积分

金牌会员

积分
2193
xchiminer 楼主

241

主题

315

回帖

2193

积分

金牌会员

积分
2193
2024-12-24 17:54:56 | 显示全部楼层

callmefeifei 发表于 2024-12-24 17:49

某研究所已经做了

求明示,只想做用户,并不想自己搞轮子。
回复

使用道具 举报

90

主题

192

回帖

1206

积分

金牌会员

积分
1206
callmefeifei

90

主题

192

回帖

1206

积分

金牌会员

积分
1206
2024-12-24 17:49:00 | 显示全部楼层

xchiminer 发表于 2024-12-24 17:54

求明示,只想做用户,并不想自己搞轮子。

1、制作识别模型(收集数据集、标注、训练出模型)
2、收集TG数据
3、用模型来识别TG数据,给人打标注,用一套算法来计算这些标注的权重,然后出分析报告。
回复

使用道具 举报

241

主题

315

回帖

2193

积分

金牌会员

积分
2193
xchiminer 楼主

241

主题

315

回帖

2193

积分

金牌会员

积分
2193
2024-12-24 17:57:15 | 显示全部楼层

rrw 发表于 2024-12-24 17:54

。。。 是不是把ai 想的 过于ai 了

这些都是数据分析,还没上到行为模拟,ai已经很ai了,比如谷歌早4月份就出了浏览器拟人化。
我说的这些已经是相当简单的text应用了。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|小黑屋|HS2V主机综合交流论坛

GMT+8, 2025-5-16 08:21 , Processed in 0.020034 second(s), 2 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表