当前位置：网站首页 > 技术文章 > 正文

WeClone 用微信聊天记录打造你的「数字分身」

ccwgpt 2025-05-26 14:14 26 浏览 0 评论

一、WeClone 是什么？

WeClone 是一款开源项目，旨在通过分析用户的微信聊天记录和语音数据，训练出高度个性化的 AI 数字分身。它能模仿用户的语言风格、表情习惯甚至语音语调，并支持部署到微信、QQ、飞书等社交平台，实现自动化互动。

核心目标：探索“数字永生”可能性，同时为个人和企业提供低门槛的个性化 AI 代理工具。

二、核心功能与亮点

个性化对话克隆

数据来源：微信聊天记录（通过 PyWxDump 工具导出 CSV 文件），自动处理成问答对格式并过滤敏感信息（如手机号、身份证号）。

模型训练：基于 Qwen2.5-7B、ChatGLM3-6B 等大语言模型，采用 LoRA 微调技术，仅需 16GB 显存即可训练出拟真对话风格。

场景适配：根据对话上下文调整回复，例如在社群运营中自动回复常见问题或模仿用户幽默语气。

高精度语音克隆（WeClone-Audio）

使用 0.5B 参数的轻量级模型（如 Spark-TTS），仅需 5 秒语音样本即可复刻用户声音，支持情感迁移（如生气、开心）和方言模仿。显存需求低至 4GB，适合个人用户快速部署。

多平台部署与扩展

支持微信、QQ、Telegram、飞书等平台，通过 AstrBot 框架 实现自动化消息回。提供 Docker 容器化部署和 API 接口，方便开发者集成到企业系统（如客服机器人）。

三、技术实现路径

数据准备

使用 PyWxDump 解密微信数据库并导出聊天记录，按时间窗口策略合并连续消息，生成训练数据集。内置禁用词库（blocked_words），可自定义过滤敏感内容。

模型训练优化

显存控制：QLoRA 量化技术可将 7B 模型训练显存需求降至 4GB，14B 模型仅需 12GB。

分布式训练：支持多卡并行（DeepSpeed 框架），提升大规模数据训练效率。

部署与交互

本地部署：通过 web_demo.py 启动交互式网页端测试。

云端扩展：支持 OpenAI 兼容 API，可对接企业级聊天机器人平台。

四、硬件要求与成本

模型规模	微调方法	显存需求	适用场景
7B	LoRA	16GB	个人数字分身
14B	QLoRA 4-bit	12GB	高精度企业客服
70B	DeepSpeed	160GB	科研级深度克隆

开源地址与资源

GitHub 仓库：https://github.com/xming521/WeClone
配套工具 PyWxDump：https://github.com/xaoyaoo/PyWxDump

环境搭建

1.cuda安装(已安装可跳过，要求版本12.4及以上)：LLaMA Factory

2.建议使用 uv安装依赖，这是一个非常快速的 Python 环境管理器。安装uv后，您可以使用以下命令创建一个新的Python环境并安装依赖项，注意这不包含音频克隆功能的依赖：

git clone https://github.com/xming521/WeClone.git
cd WeClone
uv venv .venv --python=3.10
source .venv/bin/activate # windows下执行 .venv\Scripts\activate
uv pip install --group main -e .

Tip

如果要使用最新的模型进行微调，需要手动安装最新版LLaMA Factory：uv pip install --upgrade git+
https://github.com/hiyouga/LLaMA-Factory.git,同时其他依赖版本也可能需要修改，例如vllm pytorch transforms

3.将配置文件模板复制一份并重命名为settings.jsonc，后续配置修改在此文件进行：

cp settings.template.json settings.jsonc

Note

训练以及推理相关配置统一在文件settings.jsonc

4.使用以下命令测试CUDA环境是否正确配置并可被PyTorch识别，Mac不需要：

python -c "import torch; print('CUDA是否可用:', torch.cuda.is_available());"

5.（可选）安装FlashAttention，加速训练和推理：uv pip install flash-attn --no-build-isolation

数据准备

请使用PyWxDump提取微信聊天记录。可以先将手机的聊天记录迁移（备份）到电脑，数据量更多一些。下载软件并解密数据库后，点击聊天备份，导出类型为CSV，可以导出多个联系人（不建议使用群聊记录），然后将导出的位于wxdump_tmp/export 的 csv 文件夹放在./dataset目录即可，也就是不同人聊天记录的文件夹一起放在 ./dataset/csv。

数据预处理

项目默认去除了数据中的手机号、身份证号、邮箱、网址。还在settings.jsonc中提供了一个禁用词词库blocked_words，可以自行添加需要过滤的词句（会默认去掉包括禁用词的整句）。

Important

请一定注意保护个人隐私，不要泄露个人信息！

执行以下命令对数据进行处理，可以根据自己的聊天风格修改settings.jsonc的make_dataset_args。

weclone-cli make-dataset

目前仅支持时间窗口策略，根据single_combine_time_window将单人连续消息通过逗号连接合并为一句，根据qa_match_time_window匹配问答对。
可以启用clean_dataset中的enable_clean选项，对数据进行清洗，以达到更好效果。当前使用llm judge对聊天记录进行打分，使用vllm进行离线推理。在得到llm打分分数分布情况后，调整accept_score选择可以接受的分数，再适当降低train_sft_args的lora_dropout参数提升拟合效果。

模型下载

git lfs install
git clone https://www.modelscope.cn/Qwen/Qwen2.5-7B-Instruct.git

配置参数并微调模型

(可选)修改 settings.jsonc 的 model_name_or_path 和 template 选择本地下载好的其他模型。
修改per_device_train_batch_size以及gradient_accumulation_steps来调整显存占用。
可以根据自己数据集的数量和质量修改train_sft_args的num_train_epochs、lora_rank、lora_dropout等参数。

单卡训练

weclone-cli train-sft

多卡环境单卡训练，需要先执行 export CUDA_VISIBLE_DEVICES=0

多卡训练

取消settings.jsonc中deepspeed行代码注释，使用以下命令多卡训练：

uv pip install deepspeed
deepspeed --num_gpus=使用显卡数量 weclone/train/train_sft.py

使用浏览器demo简单推理

可以在这一步测试出合适的temperature、top_p值，修改settings.jsonc的infer_args后，供后续推理时使用。

weclone-cli webchat-demo

使用接口进行推理

weclone-cli server

使用常见聊天问题测试

不包含询问个人信息的问题，仅有日常聊天。测试结果在test_result-my.txt。

weclone-cli server
weclone-cli test-model

微调效果

使用Qwen2.5-14B-Instruct模型，大概3万条处理后的有效数据，loss降到了3.5左右的效果。

截图

部署到聊天机器人

AstrBot 是易上手的多平台 LLM 聊天机器人及开发框架平台支持 QQ、QQ频道、Telegram、微信、企微、飞书。

使用步骤：

部署 AstrBot
在 AstrBot 中部署消息平台
执行 weclone-cli server 启动api服务
在 AstrBot 中新增服务提供商，类型选择OpenAI，API Base URL 根据AstrBot部署方式填写（例如docker部署可能为http://172.17.0.1:8005/v1），模型填写gpt-3.5-turbo,API Key随意填写一个
微调后不支持工具调用，请先关掉默认的工具，消息平台发送指令： /tool off all，否则会没有微调后的效果。
根据微调时使用的default_system，在 AstrBot 中设置系统提示词。

Important

检查api_service的日志，尽量保证大模型服务请求的参数和微调时一致，tool插件能力都关掉。

调整采样参数，例如temperature、top_p、top_k等配置自定义的模型参数

微信机器人框架

上一篇：使用wxauto实现AI微信聊天机器人
下一篇：微信+DeepSeek，又有大动作!可一键创建专属“智能机器人”

WeClone 用微信聊天记录打造你的「数字分身」

一、WeClone 是什么？

二、核心功能与亮点

三、技术实现路径

四、硬件要求与成本

环境搭建

数据准备

数据预处理

模型下载

配置参数并微调模型

单卡训练

多卡训练

使用浏览器demo简单推理

使用接口进行推理

使用常见聊天问题测试

微调效果

部署到聊天机器人

相关推荐

取消回复欢迎你发表评论:

使用cheat engine修改unity游戏（cheat engine教程）

1分钟了解Tableau

钉钉打卡虚拟定位赶快点赞收藏吧!

超级硬核的钉钉模拟wifi，定位，远程打卡教程

足不出户便能环游世界!手机发微信朋友圈如何定位到国外?

6米跨度柱子一般多大?框架结构的柱子应该设置多大?

项目使用 Jfrog Artifactory 制品库

.NET 多版本 WinForm 开源控件库 SunnyUI 技术解析与示例代码

美国陆军游骑兵和长程侦察巡逻部队军服图册

SpringBoot的starter到底是什么?

WeClone 用微信聊天记录打造你的「数字分身」

一、WeClone 是什么？

二、核心功能与亮点

三、技术实现路径

四、硬件要求与成本

环境搭建

数据准备

数据预处理

模型下载

配置参数并微调模型

单卡训练

多卡训练

使用浏览器demo简单推理

使用接口进行推理

使用常见聊天问题测试

微调效果

部署到聊天机器人

相关推荐

取消回复欢迎 你 发表评论:

使用cheat engine修改unity游戏（cheat engine教程）

1分钟了解Tableau

钉钉打卡虚拟定位赶快点赞收藏吧!

超级硬核的钉钉模拟wifi，定位，远程打卡教程

足不出户便能环游世界!手机发微信朋友圈如何定位到国外?

6米跨度柱子一般多大?框架结构的柱子应该设置多大?

项目使用 Jfrog Artifactory 制品库

.NET 多版本 WinForm 开源控件库 SunnyUI 技术解析与示例代码

美国陆军游骑兵和长程侦察巡逻部队军服图册

SpringBoot的starter到底是什么?

取消回复欢迎你发表评论: