WeChatMsg/app/DataBase/output_pc.py

import csv
import html
import os
from re import findall
from PyQt5.QtCore import pyqtSignal, QThread, QFile, QIODevice, QTextStream
from PyQt5.QtWidgets import QFileDialog
# from eyed3 import load

from . import msg_db, micro_msg_db
from .package_msg import PackageMsg
from ..DataBase import hard_link_db
from ..DataBase import media_msg_db
from ..person import MePC
from ..util import path
import shutil

from ..util.compress_content import parser_reply
from ..util.emoji import get_emoji

os.makedirs('./data/聊天记录', exist_ok=True)


def makedirs(path):
    os.makedirs(path, exist_ok=True)
    os.makedirs(os.path.join(path, 'image'), exist_ok=True)
    os.makedirs(os.path.join(path, 'emoji'), exist_ok=True)
    os.makedirs(os.path.join(path, 'video'), exist_ok=True)
    os.makedirs(os.path.join(path, 'voice'), exist_ok=True)
    os.makedirs(os.path.join(path, 'file'), exist_ok=True)
    os.makedirs(os.path.join(path, 'avatar'), exist_ok=True)


def escape_js_and_html(input_str):
    # 转义HTML特殊字符
    html_escaped = html.escape(input_str, quote=False)

    # 手动处理JavaScript转义字符
    js_escaped = (
        html_escaped
        .replace("\\", "\\\\")
        .replace("'", r"\'")
        .replace('"', r'\"')
        .replace("\n", r'\n')
        .replace("\r", r'\r')
        .replace("\t", r'\t')
    )

    return js_escaped


class Output(QThread):
    """
    发送信息线程
    """
    progressSignal = pyqtSignal(int)
    rangeSignal = pyqtSignal(int)
    okSignal = pyqtSignal(int)
    i = 1
    CSV = 0
    DOCX = 1
    HTML = 2
    CSV_ALL = 3
    CONTACT_CSV = 4
    TXT = 5

    def __init__(self, contact, type_=DOCX, message_types={}, parent=None):
        super().__init__(parent)
        self.Child0 = None
        self.last_timestamp = 0
        self.message_types = message_types
        self.sec = 2  # 默认1000秒
        self.contact = contact
        self.ta_username = contact.wxid if contact else ''
        self.msg_id = 0
        self.output_type = type_
        self.total_num = 0
        self.num = 0

    def progress(self, value):
        self.progressSignal.emit(value)

    def to_csv_all(self):
        origin_docx_path = f"{os.path.abspath('.')}/data/聊天记录/"
        os.makedirs(origin_docx_path, exist_ok=True)
        filename = QFileDialog.getSaveFileName(None, "save file", os.path.join(os.getcwd(), 'messages.csv'),
                                               "csv files (*.csv);;all files(*.*)")
        if not filename[0]:
            return
        filename = filename[0]
        # columns = ["用户名", "消息内容", "发送时间", "发送状态", "消息类型", "isSend", "msgId"]
        columns = ['localId', 'TalkerId', 'Type', 'SubType',
                   'IsSender', 'CreateTime', 'Status', 'StrContent',
                   'StrTime', 'Remark', 'NickName', 'Sender']

        packagemsg = PackageMsg()
        messages = packagemsg.get_package_message_all()
        # 写入CSV文件
        with open(filename, mode='w', newline='', encoding='utf-8') as file:
            writer = csv.writer(file)
            writer.writerow(columns)
            # 写入数据
            writer.writerows(messages)
        self.okSignal.emit(1)

    def contact_to_csv(self):
        filename = QFileDialog.getSaveFileName(None, "save file", os.path.join(os.getcwd(), 'contacts.csv'),
                                               "csv files (*.csv);;all files(*.*)")
        if not filename[0]:
            return
        filename = filename[0]
        # columns = ["用户名", "消息内容", "发送时间", "发送状态", "消息类型", "isSend", "msgId"]
        columns = ['UserName', 'Alias', 'Type', 'Remark', 'NickName', 'PYInitial', 'RemarkPYInitial', 'smallHeadImgUrl',
                   'bigHeadImgUrl']
        contacts = micro_msg_db.get_contact()
        # 写入CSV文件
        with open(filename, mode='w', newline='', encoding='utf-8') as file:
            writer = csv.writer(file)
            writer.writerow(columns)
            # 写入数据
            writer.writerows(contacts)
        self.okSignal.emit(1)

    def run(self):
        if self.output_type == self.DOCX:
            return
        elif self.output_type == self.CSV_ALL:
            self.to_csv_all()
        elif self.output_type == self.CONTACT_CSV:
            self.contact_to_csv()
        else:
            self.Child = ChildThread(self.contact, type_=self.output_type, message_types=self.message_types)
            self.Child.progressSignal.connect(self.progress)
            self.Child.rangeSignal.connect(self.rangeSignal)
            self.Child.okSignal.connect(self.okSignal)
            self.Child.start()

    def cancel(self):
        self.requestInterruption()


def modify_audio_metadata(audiofile, new_artist): # 修改音频元数据中的“创作者”标签
    return
    audiofile = load(audiofile)
    
    # 检查文件是否有标签
    if audiofile.tag is None:
        audiofile.initTag()

    # 修改艺术家名称
    audiofile.tag.artist = new_artist
    audiofile.tag.save()


class ChildThread(QThread):
    """
        子线程，用于导出部分聊天记录
    """
    progressSignal = pyqtSignal(int)
    rangeSignal = pyqtSignal(int)
    okSignal = pyqtSignal(int)
    i = 1
    CSV = 0
    DOCX = 1
    HTML = 2

    def __init__(self, contact, type_=DOCX, message_types={}, parent=None):
        super().__init__(parent)
        self.contact = contact
        self.message_types = message_types
        self.last_timestamp = 0
        self.sec = 2  # 默认1000秒
        self.msg_id = 0
        self.output_type = type_

    def is_5_min(self, timestamp):
        if abs(timestamp - self.last_timestamp) > 300:
            self.last_timestamp = timestamp
            return True
        return False

    def text(self, doc, message):
        type_ = message[2]
        str_content = message[7]
        str_time = message[8]
        is_send = message[4]
        timestamp = message[5]
        is_chatroom = 1 if self.contact.is_chatroom else 0
        if is_chatroom:
            avatar = f"./avatar/{message[12].wxid}.png"
        else:
            avatar = f"./avatar/{MePC().wxid if is_send else self.contact.wxid}.png"
        if is_chatroom:
            if is_send:
                displayname = MePC().name
            else:
                displayname = message[12].remark
        else:
            displayname = MePC().name if is_send else self.contact.remark
        displayname = escape_js_and_html(displayname)
        if self.output_type == Output.HTML:
            str_content = escape_js_and_html(str_content)
            doc.write(
                f'''{{ type:{1}, text: '{str_content}',is_send:{is_send},avatar_path:'{avatar}',timestamp:{timestamp},is_chatroom:{is_chatroom},displayname:'{displayname}'}},'''
            )
        elif self.output_type == Output.TXT:
            name = '你' if is_send else self.contact.remark
            doc.write(
                f'''{str_time} {name}\n{str_content}\n\n'''
            )

    def image(self, doc, message):
        origin_docx_path = f"{os.path.abspath('.')}/data/聊天记录/{self.contact.remark}"
        type_ = message[2]
        str_content = message[7]
        str_time = message[8]
        is_send = message[4]
        BytesExtra = message[10]
        timestamp = message[5]
        is_chatroom = 1 if self.contact.is_chatroom else 0
        if is_chatroom:
            avatar = f"./avatar/{message[12].wxid}.png"
        else:
            avatar = f"./avatar/{MePC().wxid if is_send else self.contact.wxid}.png"
        if is_chatroom:
            if is_send:
                displayname = MePC().name
            else:
                displayname = message[12].remark
        else:
            displayname = MePC().name if is_send else self.contact.remark
        displayname = escape_js_and_html(displayname)
        if self.output_type == Output.HTML:
            str_content = escape_js_and_html(str_content)
            image_path = hard_link_db.get_image(str_content, BytesExtra, thumb=False)
            image_thumb_path = hard_link_db.get_image(str_content, BytesExtra, thumb=True)
            if not os.path.exists(os.path.join(MePC().wx_dir, image_path)):
                image_path = None
            if not os.path.exists(os.path.join(MePC().wx_dir, image_thumb_path)):
                image_thumb_path = None
            if image_path is None and image_thumb_path is not None:
                image_path = image_thumb_path
            if image_path is None and image_thumb_path is None:
                return
            image_path = path.get_relative_path(image_path, base_path=f'/data/聊天记录/{self.contact.remark}/image')
            image_path = image_path.replace('/', '\\')
            try:
                os.utime(origin_docx_path + image_path[1:], (timestamp, timestamp))
            except:
                print("网络图片",image_path)
                pass
            image_path = image_path.replace('\\', '/')
            doc.write(
                f'''{{ type:{type_}, text: '{image_path}',is_send:{is_send},avatar_path:'{avatar}',timestamp:{timestamp},is_chatroom:{is_chatroom},displayname:'{displayname}'}},'''
            )
        elif self.output_type == Output.TXT:
            name = '你' if is_send else self.contact.remark
            doc.write(
                f'''{str_time} {name}\n[图片]\n\n'''
            )

    def audio(self, doc, message):
        origin_docx_path = f"{os.path.abspath('.')}/data/聊天记录/{self.contact.remark}"
        str_content = message[7]
        str_time = message[8]
        is_send = message[4]
        msgSvrId = message[9]
        timestamp = message[5]
        is_chatroom = 1 if self.contact.is_chatroom else 0
        if is_chatroom:
            avatar = f"./avatar/{message[12].wxid}.png"
        else:
            avatar = f"./avatar/{MePC().wxid if is_send else self.contact.wxid}.png"
        if is_chatroom:
            if is_send:
                displayname = MePC().name
            else:
                displayname = message[12].remark
        else:
            displayname = MePC().name if is_send else self.contact.remark
        displayname = escape_js_and_html(displayname)
        if self.output_type == Output.HTML:
            try:
                audio_path = media_msg_db.get_audio(msgSvrId, output_path=origin_docx_path + "/voice")
                audio_path = audio_path.replace('/', '\\')
                modify_audio_metadata(audio_path, displayname)
                os.utime(audio_path, (timestamp, timestamp))
                audio_path = audio_path.replace('\\', '/')
                audio_path = "./voice/" + os.path.basename(audio_path)
                voice_to_text = escape_js_and_html(media_msg_db.get_audio_text(str_content))
            except:
                return
            doc.write(
                f'''{{ type:34, text:'{audio_path}',is_send:{is_send},avatar_path:'{avatar}',voice_to_text:'{voice_to_text}',timestamp:{timestamp},is_chatroom:{is_chatroom},displayname:'{displayname}'}},'''
            )
        if self.output_type == Output.TXT:
            name = '你' if is_send else self.contact.remark
            doc.write(
                f'''{str_time} {name}\n[语音]\n\n'''
            )

    def emoji(self, doc, message):
        origin_docx_path = f"{os.path.abspath('.')}/data/聊天记录/{self.contact.remark}"
        str_content = message[7]
        str_time = message[8]
        is_send = message[4]
        timestamp = message[5]
        is_chatroom = 1 if self.contact.is_chatroom else 0
        if is_chatroom:
            avatar = f"./avatar/{message[12].wxid}.png"
        else:
            avatar = f"./avatar/{MePC().wxid if is_send else self.contact.wxid}.png"
        if is_chatroom:
            if is_send:
                displayname = MePC().name
            else:
                displayname = message[12].remark
        else:
            displayname = MePC().name if is_send else self.contact.remark
        displayname = escape_js_and_html(displayname)
        if self.output_type == Output.HTML:
            emoji_path = get_emoji(str_content, thumb=True, output_path=origin_docx_path + '/emoji')
            emoji_path = './emoji/' + os.path.basename(emoji_path)
            doc.write(
                f'''{{ type:{3}, text: '{emoji_path}',is_send:{is_send},avatar_path:'{avatar}',timestamp:{timestamp},is_chatroom:{is_chatroom},displayname:'{displayname}'}},'''
            )
        elif self.output_type == Output.TXT:
            name = '你' if is_send else self.contact.remark
            doc.write(
                f'''{str_time} {name}\n[表情包]\n\n'''
            )

    def wx_file(self, doc, isSend, content, status):
        return

    def retract_message(self, doc, isSend, content, status):
        return

    def refermsg(self, doc, message):
        """
        处理回复消息
        @param doc:
        @param message:
        @return:
        """
        str_time = message[8]
        is_send = message[4]
        content = parser_reply(message[11])
        refer_msg = content.get('refer')
        timestamp = message[5]
        is_chatroom = 1 if self.contact.is_chatroom else 0
        if is_chatroom:
            avatar = f"./avatar/{message[12].wxid}.png"
        else:
            avatar = f"./avatar/{MePC().wxid if is_send else self.contact.wxid}.png"
        if is_chatroom:
            if is_send:
                displayname = MePC().name
            else:
                displayname = message[12].remark
        else:
            displayname = MePC().name if is_send else self.contact.remark
        displayname = escape_js_and_html(displayname)
        if self.output_type == Output.HTML:
            contentText = escape_js_and_html(content.get('title'))
            if refer_msg:
                referText = f"{escape_js_and_html(refer_msg.get('displayname'))}：{escape_js_and_html(refer_msg.get('content'))}"
                doc.write(
                    f'''{{ type:49, text: '{contentText}',is_send:{is_send},sub_type:{content.get('type')},refer_text: '{referText}',avatar_path:'{avatar}',timestamp:{timestamp},is_chatroom:{is_chatroom},displayname:'{displayname}'}},'''
                )
            else:
                doc.write(
                    f'''{{ type:49, text: '{contentText}',is_send:{is_send},sub_type:{content.get('type')},avatar_path:'{avatar}',timestamp:{timestamp},is_chatroom:{is_chatroom},displayname:'{displayname}'}},'''
                )
        elif self.output_type == Output.TXT:
            name = '你' if is_send else self.contact.remark
            if refer_msg:
                doc.write(
                    f'''{str_time} {name}\n{content.get('title')}\n引用:{refer_msg.get('displayname')}:{refer_msg.get('content')}\n\n'''
                )
            else:
                doc.write(
                    f'''{str_time} {name}\n{content.get('title')}\n引用:未知\n\n'''
                )

    def system_msg(self, doc, message):
        str_content = message[7]
        is_send = message[4]
        str_time = message[8]
        timestamp = message[5]
        is_chatroom = 1 if self.contact.is_chatroom else 0
        str_content = str_content.replace('<![CDATA[', "").replace(' <a href="weixin://revoke_edit_click">重新编辑</a>]]>', "")
        res = findall('(</{0,1}(img|revo|_wc_cus|a).*?>)', str_content)
        for xmlstr, b in res:
            str_content = str_content.replace(xmlstr, "")
        str_content = escape_js_and_html(str_content)
        if self.output_type == Output.HTML:
            doc.write(
                f'''{{ type:0, text: '{str_content}',is_send:{is_send},avatar_path:'',timestamp:{timestamp},is_chatroom:{is_chatroom},displayname:''}},'''
            )
        elif self.output_type == Output.TXT:
            name = '你' if is_send else self.contact.remark
            doc.write(
                f'''{str_time} {name}\n{str_content}\n\n'''
            )

    def video(self, doc, message):
        origin_docx_path = f"{os.path.abspath('.')}/data/聊天记录/{self.contact.remark}"
        type_ = message[2]
        str_content = message[7]
        str_time = message[8]
        is_send = message[4]
        BytesExtra = message[10]
        timestamp = message[5]
        is_chatroom = 1 if self.contact.is_chatroom else 0
        if is_chatroom:
            avatar = f"./avatar/{message[12].wxid}.png"
        else:
            avatar = f"./avatar/{MePC().wxid if is_send else self.contact.wxid}.png"
        if is_chatroom:
            if is_send:
                displayname = MePC().name
            else:
                displayname = message[12].remark
        else:
            displayname = MePC().name if is_send else self.contact.remark
        displayname = escape_js_and_html(displayname)
        if self.output_type == Output.HTML:
            video_path = hard_link_db.get_video(str_content, BytesExtra, thumb=False)
            image_path = hard_link_db.get_video(str_content, BytesExtra, thumb=True)
            if video_path is None and image_path is not None:
                image_path = path.get_relative_path(image_path, base_path=f'/data/聊天记录/{self.contact.remark}/image')
                try:
                    # todo 网络图片问题
                    print(origin_docx_path + image_path[1:])
                    os.utime(origin_docx_path + image_path[1:], (timestamp, timestamp))
                    image_path = image_path.replace('\\', '/')
                    # print(f"tohtml:---{image_path}")

                    doc.write(
                        f'''{{ type:3, text: '{image_path}',is_send:{is_send},avatar_path:'{avatar}',timestamp:{timestamp},is_chatroom:{is_chatroom},displayname:'{displayname}'}},'''
                    )
                except:
                    doc.write(
                        f'''{{ type:1, text: '视频丢失',is_send:{is_send},avatar_path:'{avatar}',timestamp:{timestamp},is_chatroom:{is_chatroom},displayname:'{displayname}'}},'''
                    )
                return
            if video_path is None and image_path is None:
                return
            video_path = f'{MePC().wx_dir}/{video_path}'
            if os.path.exists(video_path):
                new_path = origin_docx_path + '/video/' + os.path.basename(video_path)
                if not os.path.exists(new_path):
                    shutil.copy(video_path, os.path.join(origin_docx_path, 'video'))
                os.utime(new_path, (timestamp, timestamp))
                video_path = f'./video/{os.path.basename(video_path)}'
            video_path = video_path.replace('\\', '/')
            doc.write(
                f'''{{ type:{type_}, text: '{video_path}',is_send:{is_send},avatar_path:'{avatar}',timestamp:{timestamp},is_chatroom:{is_chatroom},displayname:'{displayname}'}},'''
            )
        elif self.output_type == Output.TXT:
            name = '你' if is_send else self.contact.remark
            doc.write(
                f'''{str_time} {name}\n[视频]\n\n'''
            )

    def to_csv(self):
        origin_docx_path = f"{os.path.abspath('.')}/data/聊天记录/{self.contact.remark}"
        os.makedirs(origin_docx_path, exist_ok=True)
        filename = f"{os.path.abspath('.')}/data/聊天记录/{self.contact.remark}/{self.contact.remark}_utf8.csv"
        # columns = ["用户名", "消息内容", "发送时间", "发送状态", "消息类型", "isSend", "msgId"]
        columns = ['localId', 'TalkerId', 'Type', 'SubType',
                   'IsSender', 'CreateTime', 'Status', 'StrContent',
                   'StrTime']
        messages = msg_db.get_messages(self.contact.wxid)
        # 写入CSV文件
        with open(filename, mode='w', newline='', encoding='utf-8') as file:
            writer = csv.writer(file)
            writer.writerow(columns)
            # 写入数据
            writer.writerows(messages)
        self.okSignal.emit('ok')

    def to_html_(self):
        origin_docx_path = f"{os.path.abspath('.')}/data/聊天记录/{self.contact.remark}"
        makedirs(origin_docx_path)
        if self.contact.is_chatroom:
            packagemsg = PackageMsg()
            messages = packagemsg.get_package_message_by_wxid(self.contact.wxid)
        else:
            messages = msg_db.get_messages(self.contact.wxid)
        filename = f"{os.path.abspath('.')}/data/聊天记录/{self.contact.remark}/{self.contact.remark}.html"
        file = QFile(':/data/template.html')
        if file.open(QIODevice.ReadOnly | QIODevice.Text):
            stream = QTextStream(file)
            stream.setCodec('utf-8')
            content = stream.readAll()
            file.close()
            html_head,html_end = content.split('/*注意看这是分割线*/')
        f = open(filename, 'w', encoding='utf-8')
        f.write(html_head.replace("<title>Chat Records</title>", f"<title>{self.contact.remark}</title>"))
        MePC().avatar.save(os.path.join(f"{origin_docx_path}/avatar/{MePC().wxid}.png"))
        if self.contact.is_chatroom:
            for message in messages:
                if message[4]: # is_send
                    continue
                try:
                    chatroom_avatar_path = f"{origin_docx_path}/avatar/{message[12].wxid}.png"
                    if not os.path.exists(chatroom_avatar_path):
                        message[12].avatar.save(chatroom_avatar_path)
                except:
                    print(message)
                    pass
        else:
            self.contact.avatar.save(os.path.join(f"{origin_docx_path}/avatar/{self.contact.wxid}.png"))
        self.rangeSignal.emit(len(messages))
        total_steps = len(messages)
        for index, message in enumerate(messages):
            type_ = message[2]
            sub_type = message[3]
            timestamp = message[5]
            self.progressSignal.emit(int((index + 1) / total_steps * 100))
            if self.is_5_min(timestamp):
                str_time = message[8]
                f.write(
                    f'''{{ type:0, text: '{str_time}',is_send:0,avatar_path:'',timestamp:{timestamp}}},'''
                )
            if type_ == 1 and self.message_types.get(type_):
                self.text(f, message)
            elif type_ == 3 and self.message_types.get(type_):
                self.image(f, message)
            elif type_ == 34 and self.message_types.get(type_):
                self.audio(f, message)
            elif type_ == 43 and self.message_types.get(type_):
                self.video(f, message)
            elif type_ == 47 and self.message_types.get(type_):
                self.emoji(f, message)
            elif type_ == 10000 and self.message_types.get(type_):
                self.system_msg(f, message)
            elif type_ == 49 and sub_type == 57 and self.message_types.get(1):
                self.refermsg(f, message)
        f.write(html_end)
        f.close()
        self.okSignal.emit(1)

    def to_txt(self):
        origin_docx_path = f"{os.path.abspath('.')}/data/聊天记录/{self.contact.remark}"
        os.makedirs(origin_docx_path, exist_ok=True)
        filename = f"{os.path.abspath('.')}/data/聊天记录/{self.contact.remark}/{self.contact.remark}.txt"
        messages = msg_db.get_messages(self.contact.wxid)
        total_steps = len(messages)
        with open(filename, mode='w', newline='', encoding='utf-8') as f:
            for index, message in enumerate(messages):
                type_ = message[2]
                sub_type = message[3]
                self.progressSignal.emit(int((index + 1) / total_steps * 100))
                if type_ == 1 and self.message_types.get(type_):
                    self.text(f, message)
                elif type_ == 3 and self.message_types.get(type_):
                    self.image(f, message)
                elif type_ == 34 and self.message_types.get(type_):
                    self.audio(f, message)
                elif type_ == 43 and self.message_types.get(type_):
                    self.video(f, message)
                elif type_ == 47 and self.message_types.get(type_):
                    self.emoji(f, message)
                elif type_ == 10000 and self.message_types.get(type_):
                    self.system_msg(f, message)
                elif type_ == 49 and sub_type == 57:
                    self.refermsg(f, message)
        self.okSignal.emit(1)

    def run(self):
        if self.output_type == Output.DOCX:
            return
        elif self.output_type == Output.CSV:
            self.to_csv()
        elif self.output_type == Output.HTML:
            self.to_html_()
        elif self.output_type == Output.CSV_ALL:
            self.to_csv_all()
        elif self.output_type == Output.TXT:
            self.to_txt()

    def cancel(self):
        self.requestInterruption()
-												移除pandas

											
										
										
											2023-11-25 00:40:09 +08:00
+								import csv
-												修复str_content转义问题

											
										
										
											2023-11-28 21:30:56 +08:00
+								import html
-												修复db文件空格路径的bug

											
										
										
											2023-11-15 23:53:39 +08:00
+								import os
-												用户可自定义选择导出HTML的消息类型

											
										
										
											2023-12-10 18:55:17 +08:00
+								from re import findall
-												修改HTML模板

											
										
										
											2023-12-22 21:21:30 +08:00
+								from PyQt5.QtCore import pyqtSignal, QThread, QFile, QIODevice, QTextStream
-												新增导出联系人功能

											
										
										
											2023-12-07 20:35:51 +08:00
+								from PyQt5.QtWidgets import QFileDialog
-												支持显示群聊

											
										
										
											2023-12-17 20:31:38 +08:00
+								# from eyed3 import load
-												新增聊天记录导出csv格式

											
										
										
											2023-11-16 22:39:59 +08:00
-												新增导出联系人功能

											
										
										
											2023-12-07 20:35:51 +08:00
+								from . import msg_db, micro_msg_db
-												导出csv文件时，增加发送人名称、接受者名称、备注名字段

											
										
										
											2023-12-06 15:34:56 +08:00
+								from .package_msg import PackageMsg
-												用单例实现数据库操作,弃用全局变量

											
										
										
											2023-12-01 22:37:45 +08:00
+								from ..DataBase import hard_link_db
-												html语音消息支持导出，如果电脑转过文字那么转的文字也可以显示出来

											
										
										
											2023-12-12 01:17:21 +08:00
+								from ..DataBase import media_msg_db
-												解决多次解密导致的数据重复问题

											
										
										
											2023-12-13 22:12:50 +08:00
+								from ..person import MePC
-												优化聊天记录文件的存储结构 #81

											
										
										
											2023-12-06 20:50:32 +08:00
+								from ..util import path
-												支持导出表情包

											
										
										
											2023-12-09 22:48:15 +08:00
+								import shutil
-												支持导出引用消息类型

											
										
										
											2023-12-11 22:49:17 +08:00
+								from ..util.compress_content import parser_reply
-												支持导出表情包

											
										
										
											2023-12-09 22:48:15 +08:00
+								from ..util.emoji import get_emoji
-												HTML支持导出图片

											
										
										
											2023-11-28 21:51:49 +08:00
-												修复目录创建问题

											
										
										
											2023-12-03 00:03:00 +08:00
+								os.makedirs('./data/聊天记录', exist_ok=True)
-												更新wx选择的路径

											
										
										
											2023-11-20 22:30:31 +08:00
-												修复db文件空格路径的bug

											
										
										
											2023-11-15 23:53:39 +08:00
-												优化聊天记录文件的存储结构 #81

											
										
										
											2023-12-06 20:50:32 +08:00
+								def makedirs(path):
-												新增导出联系人功能

											
										
										
											2023-12-07 20:35:51 +08:00
+								    os.makedirs(path, exist_ok=True)
-												优化聊天记录文件的存储结构 #81

											
										
										
											2023-12-06 20:50:32 +08:00
+								    os.makedirs(os.path.join(path, 'image'), exist_ok=True)
 								    os.makedirs(os.path.join(path, 'emoji'), exist_ok=True)
 								    os.makedirs(os.path.join(path, 'video'), exist_ok=True)
 								    os.makedirs(os.path.join(path, 'voice'), exist_ok=True)
 								    os.makedirs(os.path.join(path, 'file'), exist_ok=True)
-												html群聊导出支持头像和昵称；修复了一些其他问题

											
										
										
											2023-12-17 18:33:06 +08:00
+								    os.makedirs(os.path.join(path, 'avatar'), exist_ok=True)
-												优化聊天记录文件的存储结构 #81

											
										
										
											2023-12-06 20:50:32 +08:00
-												修复str_content转义问题

											
										
										
											2023-11-28 21:30:56 +08:00
+								def escape_js_and_html(input_str):
 								    # 转义HTML特殊字符
 								    html_escaped = html.escape(input_str, quote=False)
 								    # 手动处理JavaScript转义字符
 								    js_escaped = (
 								        html_escaped
 								        .replace("\\", "\\\\")
 								        .replace("'", r"\'")
 								        .replace('"', r'\"')
 								        .replace("\n", r'\n')
 								        .replace("\r", r'\r')
 								        .replace("\t", r'\t')
 								    )
 								    return js_escaped
-												修复db文件空格路径的bug

											
										
										
											2023-11-15 23:53:39 +08:00
+								class Output(QThread):
 								    """
 								    发送信息线程
 								    """
 								    progressSignal = pyqtSignal(int)
 								    rangeSignal = pyqtSignal(int)
 								    okSignal = pyqtSignal(int)
 								    i = 1
 								    CSV = 0
 								    DOCX = 1
 								    HTML = 2
-												新增导出所有聊天记录到CSV

											
										
										
											2023-11-27 21:23:26 +08:00
+								    CSV_ALL = 3
-												新增导出联系人功能

											
										
										
											2023-12-07 20:35:51 +08:00
+								    CONTACT_CSV = 4
-												支持导出txt

											
										
										
											2023-12-10 19:36:08 +08:00
+								    TXT = 5
-												修复db文件空格路径的bug

											
										
										
											2023-11-15 23:53:39 +08:00
-												用户可自定义选择导出HTML的消息类型

											
										
										
											2023-12-10 18:55:17 +08:00
+								    def __init__(self, contact, type_=DOCX, message_types={}, parent=None):
-												修复db文件空格路径的bug

											
										
										
											2023-11-15 23:53:39 +08:00
+								        super().__init__(parent)
-												新增导出所有聊天记录到CSV

											
										
										
											2023-11-27 21:23:26 +08:00
+								        self.Child0 = None
-												支持导出HTML

											
										
										
											2023-11-21 22:23:23 +08:00
+								        self.last_timestamp = 0
-												用户可自定义选择导出HTML的消息类型

											
										
										
											2023-12-10 18:55:17 +08:00
+								        self.message_types = message_types
-												修复db文件空格路径的bug

											
										
										
											2023-11-15 23:53:39 +08:00
+								        self.sec = 2  # 默认1000秒
-												新增聊天记录导出csv格式

											
										
										
											2023-11-16 22:39:59 +08:00
+								        self.contact = contact
-												新增导出所有聊天记录到CSV

											
										
										
											2023-11-27 21:23:26 +08:00
+								        self.ta_username = contact.wxid if contact else ''
-												修复db文件空格路径的bug

											
										
										
											2023-11-15 23:53:39 +08:00
+								        self.msg_id = 0
 								        self.output_type = type_
 								        self.total_num = 0
-												新增聊天记录导出csv格式

											
										
										
											2023-11-16 22:39:59 +08:00
+								        self.num = 0
-												修复db文件空格路径的bug

											
										
										
											2023-11-15 23:53:39 +08:00
-												修复HTML卡顿的问题

											
										
										
											2023-11-22 00:22:50 +08:00
+								    def progress(self, value):
 								        self.progressSignal.emit(value)
-												新增导出所有聊天记录到CSV

											
										
										
											2023-11-27 21:23:26 +08:00
+								    def to_csv_all(self):
 								        origin_docx_path = f"{os.path.abspath('.')}/data/聊天记录/"
-												修复目录创建问题

											
										
										
											2023-12-03 00:03:00 +08:00
+								        os.makedirs(origin_docx_path, exist_ok=True)
-												支持导出表情包

											
										
										
											2023-12-09 22:48:15 +08:00
+								        filename = QFileDialog.getSaveFileName(None, "save file", os.path.join(os.getcwd(), 'messages.csv'),
 								                                               "csv files (*.csv);;all files(*.*)")
 								        if not filename[0]:
-												新增导出联系人功能

											
										
										
											2023-12-07 20:35:51 +08:00
+								            return
 								        filename = filename[0]
-												新增导出所有聊天记录到CSV

											
										
										
											2023-11-27 21:23:26 +08:00
+								        # columns = ["用户名", "消息内容", "发送时间", "发送状态", "消息类型", "isSend", "msgId"]
 								        columns = ['localId', 'TalkerId', 'Type', 'SubType',
 								                   'IsSender', 'CreateTime', 'Status', 'StrContent',
-												导出csv文件时，增加发送人名称、接受者名称、备注名字段

											
										
										
											2023-12-06 15:34:56 +08:00
+								                   'StrTime', 'Remark', 'NickName', 'Sender']
-												新增导出联系人功能

											
										
										
											2023-12-07 20:35:51 +08:00
-												导出csv文件时，增加发送人名称、接受者名称、备注名字段

											
										
										
											2023-12-06 15:34:56 +08:00
+								        packagemsg = PackageMsg()
 								        messages = packagemsg.get_package_message_all()
-												新增导出所有聊天记录到CSV

											
										
										
											2023-11-27 21:23:26 +08:00
+								        # 写入CSV文件
 								        with open(filename, mode='w', newline='', encoding='utf-8') as file:
 								            writer = csv.writer(file)
 								            writer.writerow(columns)
 								            # 写入数据
 								            writer.writerows(messages)
 								        self.okSignal.emit(1)
-												新增导出联系人功能

											
										
										
											2023-12-07 20:35:51 +08:00
+								    def contact_to_csv(self):
-												支持导出表情包

											
										
										
											2023-12-09 22:48:15 +08:00
+								        filename = QFileDialog.getSaveFileName(None, "save file", os.path.join(os.getcwd(), 'contacts.csv'),
 								                                               "csv files (*.csv);;all files(*.*)")
 								        if not filename[0]:
-												新增导出联系人功能

											
										
										
											2023-12-07 20:35:51 +08:00
+								            return
 								        filename = filename[0]
 								        # columns = ["用户名", "消息内容", "发送时间", "发送状态", "消息类型", "isSend", "msgId"]
-												支持导出表情包

											
										
										
											2023-12-09 22:48:15 +08:00
+								        columns = ['UserName', 'Alias', 'Type', 'Remark', 'NickName', 'PYInitial', 'RemarkPYInitial', 'smallHeadImgUrl',
 								                   'bigHeadImgUrl']
-												新增导出联系人功能

											
										
										
											2023-12-07 20:35:51 +08:00
+								        contacts = micro_msg_db.get_contact()
 								        # 写入CSV文件
 								        with open(filename, mode='w', newline='', encoding='utf-8') as file:
 								            writer = csv.writer(file)
 								            writer.writerow(columns)
 								            # 写入数据
 								            writer.writerows(contacts)
 								        self.okSignal.emit(1)
-												修复HTML卡顿的问题

											
										
										
											2023-11-22 00:22:50 +08:00
+								    def run(self):
 								        if self.output_type == self.DOCX:
 								            return
-												新增导出所有聊天记录到CSV

											
										
										
											2023-11-27 21:23:26 +08:00
+								        elif self.output_type == self.CSV_ALL:
 								            self.to_csv_all()
-												新增导出联系人功能

											
										
										
											2023-12-07 20:35:51 +08:00
+								        elif self.output_type == self.CONTACT_CSV:
 								            self.contact_to_csv()
-												新增导出所有聊天记录到CSV

											
										
										
											2023-11-27 21:23:26 +08:00
+								        else:
-												支持导出txt

											
										
										
											2023-12-10 19:36:08 +08:00
+								            self.Child = ChildThread(self.contact, type_=self.output_type, message_types=self.message_types)
-												remove .idea folder all file out of control

											
										
										
											2023-12-02 22:02:17 +08:00
+								            self.Child.progressSignal.connect(self.progress)
 								            self.Child.rangeSignal.connect(self.rangeSignal)
 								            self.Child.okSignal.connect(self.okSignal)
 								            self.Child.start()
-												新增导出所有聊天记录到CSV

											
										
										
											2023-11-27 21:23:26 +08:00
 								    def cancel(self):
 								        self.requestInterruption()
-												修复HTML卡顿的问题

											
										
										
											2023-11-22 00:22:50 +08:00
-												给音频的元数据加上创作者信息，便于本地归类查找

											
										
										
											2023-12-15 14:48:54 +08:00
+								def modify_audio_metadata(audiofile, new_artist): # 修改音频元数据中的“创作者”标签
-												支持显示群聊

											
										
										
											2023-12-17 20:31:38 +08:00
+								    return
-												给音频的元数据加上创作者信息，便于本地归类查找

											
										
										
											2023-12-15 14:48:54 +08:00
+								    audiofile = load(audiofile)
 								    # 检查文件是否有标签
 								    if audiofile.tag is None:
 								        audiofile.initTag()
 								    # 修改艺术家名称
 								    audiofile.tag.artist = new_artist
 								    audiofile.tag.save()
-												修复HTML卡顿的问题

											
										
										
											2023-11-22 00:22:50 +08:00
+								class ChildThread(QThread):
 								    """
 								        子线程，用于导出部分聊天记录
 								    """
 								    progressSignal = pyqtSignal(int)
 								    rangeSignal = pyqtSignal(int)
 								    okSignal = pyqtSignal(int)
 								    i = 1
 								    CSV = 0
 								    DOCX = 1
 								    HTML = 2
-												用户可自定义选择导出HTML的消息类型

											
										
										
											2023-12-10 18:55:17 +08:00
+								    def __init__(self, contact, type_=DOCX, message_types={}, parent=None):
-												修复HTML卡顿的问题

											
										
										
											2023-11-22 00:22:50 +08:00
+								        super().__init__(parent)
 								        self.contact = contact
-												用户可自定义选择导出HTML的消息类型

											
										
										
											2023-12-10 18:55:17 +08:00
+								        self.message_types = message_types
-												修复HTML卡顿的问题

											
										
										
											2023-11-22 00:22:50 +08:00
+								        self.last_timestamp = 0
 								        self.sec = 2  # 默认1000秒
 								        self.msg_id = 0
 								        self.output_type = type_
 								    def is_5_min(self, timestamp):
 								        if abs(timestamp - self.last_timestamp) > 300:
 								            self.last_timestamp = timestamp
 								            return True
 								        return False
-												用户可自定义选择导出HTML的消息类型

											
										
										
											2023-12-10 18:55:17 +08:00
+								    def text(self, doc, message):
 								        type_ = message[2]
 								        str_content = message[7]
 								        str_time = message[8]
 								        is_send = message[4]
 								        timestamp = message[5]
-												html群聊导出支持头像和昵称；修复了一些其他问题

											
										
										
											2023-12-17 18:33:06 +08:00
+								        is_chatroom = 1 if self.contact.is_chatroom else 0
 								        if is_chatroom:
 								            avatar = f"./avatar/{message[12].wxid}.png"
 								        else:
-												修复了自己引用页面出问题的bug，修复了单人导出时头像路径错误

											
										
										
											2023-12-17 19:37:16 +08:00
+								            avatar = f"./avatar/{MePC().wxid if is_send else self.contact.wxid}.png"
-												html群聊导出支持头像和昵称；修复了一些其他问题

											
										
										
											2023-12-17 18:33:06 +08:00
+								        if is_chatroom:
 								            if is_send:
 								                displayname = MePC().name
 								            else:
 								                displayname = message[12].remark
 								        else:
 								            displayname = MePC().name if is_send else self.contact.remark
 								        displayname = escape_js_and_html(displayname)
-												支持导出txt

											
										
										
											2023-12-10 19:36:08 +08:00
+								        if self.output_type == Output.HTML:
 								            str_content = escape_js_and_html(str_content)
 								            doc.write(
-												html群聊导出支持头像和昵称；修复了一些其他问题

											
										
										
											2023-12-17 18:33:06 +08:00
+								                f'''{{ type:{1}, text: '{str_content}',is_send:{is_send},avatar_path:'{avatar}',timestamp:{timestamp},is_chatroom:{is_chatroom},displayname:'{displayname}'}},'''
-												支持导出txt

											
										
										
											2023-12-10 19:36:08 +08:00
+								            )
 								        elif self.output_type == Output.TXT:
 								            name = '你' if is_send else self.contact.remark
-												用户可自定义选择导出HTML的消息类型

											
										
										
											2023-12-10 18:55:17 +08:00
+								            doc.write(
-												支持导出txt

											
										
										
											2023-12-10 19:36:08 +08:00
+								                f'''{str_time} {name}\n{str_content}\n\n'''
-												用户可自定义选择导出HTML的消息类型

											
										
										
											2023-12-10 18:55:17 +08:00
+								            )
 								    def image(self, doc, message):
-												把视频、音频和图片的“修改时间”属性改为其发送时间，方便在本地筛选观察

											
										
										
											2023-12-13 21:03:03 +08:00
+								        origin_docx_path = f"{os.path.abspath('.')}/data/聊天记录/{self.contact.remark}"
-												用户可自定义选择导出HTML的消息类型

											
										
										
											2023-12-10 18:55:17 +08:00
+								        type_ = message[2]
 								        str_content = message[7]
 								        str_time = message[8]
 								        is_send = message[4]
 								        BytesExtra = message[10]
-												html群聊导出支持头像和昵称；修复了一些其他问题

											
										
										
											2023-12-17 18:33:06 +08:00
+								        timestamp = message[5]
 								        is_chatroom = 1 if self.contact.is_chatroom else 0
 								        if is_chatroom:
 								            avatar = f"./avatar/{message[12].wxid}.png"
 								        else:
-												修复了自己引用页面出问题的bug，修复了单人导出时头像路径错误

											
										
										
											2023-12-17 19:37:16 +08:00
+								            avatar = f"./avatar/{MePC().wxid if is_send else self.contact.wxid}.png"
-												html群聊导出支持头像和昵称；修复了一些其他问题

											
										
										
											2023-12-17 18:33:06 +08:00
+								        if is_chatroom:
 								            if is_send:
 								                displayname = MePC().name
 								            else:
 								                displayname = message[12].remark
 								        else:
 								            displayname = MePC().name if is_send else self.contact.remark
 								        displayname = escape_js_and_html(displayname)
-												支持导出txt

											
										
										
											2023-12-10 19:36:08 +08:00
+								        if self.output_type == Output.HTML:
 								            str_content = escape_js_and_html(str_content)
 								            image_path = hard_link_db.get_image(str_content, BytesExtra, thumb=False)
 								            image_thumb_path = hard_link_db.get_image(str_content, BytesExtra, thumb=True)
-												修复image缩略图获取不了的问题；修复大缩放下html元素超出页面的问题

											
										
										
											2023-12-12 10:32:16 +08:00
+								            if not os.path.exists(os.path.join(MePC().wx_dir, image_path)):
 								                image_path = None
 								            if not os.path.exists(os.path.join(MePC().wx_dir, image_thumb_path)):
 								                image_thumb_path = None
-												支持导出txt

											
										
										
											2023-12-10 19:36:08 +08:00
+								            if image_path is None and image_thumb_path is not None:
 								                image_path = image_thumb_path
 								            if image_path is None and image_thumb_path is None:
 								                return
 								            image_path = path.get_relative_path(image_path, base_path=f'/data/聊天记录/{self.contact.remark}/image')
-												把视频、音频和图片的“修改时间”属性改为其发送时间，方便在本地筛选观察

											
										
										
											2023-12-13 21:03:03 +08:00
+								            image_path = image_path.replace('/', '\\')
-												修复网络图片的问题#156 #150

											
										
										
											2023-12-17 22:28:57 +08:00
+								            try:
 								                os.utime(origin_docx_path + image_path[1:], (timestamp, timestamp))
 								            except:
 								                print("网络图片",image_path)
 								                pass
-												支持导出txt

											
										
										
											2023-12-10 19:36:08 +08:00
+								            image_path = image_path.replace('\\', '/')
-												用户可自定义选择导出HTML的消息类型

											
										
										
											2023-12-10 18:55:17 +08:00
+								            doc.write(
-												html群聊导出支持头像和昵称；修复了一些其他问题

											
										
										
											2023-12-17 18:33:06 +08:00
+								                f'''{{ type:{type_}, text: '{image_path}',is_send:{is_send},avatar_path:'{avatar}',timestamp:{timestamp},is_chatroom:{is_chatroom},displayname:'{displayname}'}},'''
-												支持导出txt

											
										
										
											2023-12-10 19:36:08 +08:00
+								            )
 								        elif self.output_type == Output.TXT:
 								            name = '你' if is_send else self.contact.remark
 								            doc.write(
 								                f'''{str_time} {name}\n[图片]\n\n'''
-												用户可自定义选择导出HTML的消息类型

											
										
										
											2023-12-10 18:55:17 +08:00
+								            )
-												修复HTML卡顿的问题

											
										
										
											2023-11-22 00:22:50 +08:00
-												html语音消息支持导出，如果电脑转过文字那么转的文字也可以显示出来

											
										
										
											2023-12-12 01:17:21 +08:00
+								    def audio(self, doc, message):
 								        origin_docx_path = f"{os.path.abspath('.')}/data/聊天记录/{self.contact.remark}"
 								        str_content = message[7]
 								        str_time = message[8]
 								        is_send = message[4]
 								        msgSvrId = message[9]
-												html群聊导出支持头像和昵称；修复了一些其他问题

											
										
										
											2023-12-17 18:33:06 +08:00
+								        timestamp = message[5]
 								        is_chatroom = 1 if self.contact.is_chatroom else 0
 								        if is_chatroom:
 								            avatar = f"./avatar/{message[12].wxid}.png"
 								        else:
-												修复了自己引用页面出问题的bug，修复了单人导出时头像路径错误

											
										
										
											2023-12-17 19:37:16 +08:00
+								            avatar = f"./avatar/{MePC().wxid if is_send else self.contact.wxid}.png"
-												html群聊导出支持头像和昵称；修复了一些其他问题

											
										
										
											2023-12-17 18:33:06 +08:00
+								        if is_chatroom:
 								            if is_send:
 								                displayname = MePC().name
 								            else:
 								                displayname = message[12].remark
 								        else:
 								            displayname = MePC().name if is_send else self.contact.remark
 								        displayname = escape_js_and_html(displayname)
-												html语音消息支持导出，如果电脑转过文字那么转的文字也可以显示出来

											
										
										
											2023-12-12 01:17:21 +08:00
+								        if self.output_type == Output.HTML:
 								            try:
 								                audio_path = media_msg_db.get_audio(msgSvrId, output_path=origin_docx_path + "/voice")
-												把视频、音频和图片的“修改时间”属性改为其发送时间，方便在本地筛选观察

											
										
										
											2023-12-13 21:03:03 +08:00
+								                audio_path = audio_path.replace('/', '\\')
-												html群聊导出支持头像和昵称；修复了一些其他问题

											
										
										
											2023-12-17 18:33:06 +08:00
+								                modify_audio_metadata(audio_path, displayname)
-												把视频、音频和图片的“修改时间”属性改为其发送时间，方便在本地筛选观察

											
										
										
											2023-12-13 21:03:03 +08:00
+								                os.utime(audio_path, (timestamp, timestamp))
-												html语音消息支持导出，如果电脑转过文字那么转的文字也可以显示出来

											
										
										
											2023-12-12 01:17:21 +08:00
+								                audio_path = audio_path.replace('\\', '/')
-												修复语音相对路径问题
											
										
										
											2023-12-19 14:26:15 +08:00
+								                audio_path = "./voice/" + os.path.basename(audio_path)
-												忘记对语音转的文字escape了

											
										
										
											2023-12-16 12:58:29 +08:00
+								                voice_to_text = escape_js_and_html(media_msg_db.get_audio_text(str_content))
-												html语音消息支持导出，如果电脑转过文字那么转的文字也可以显示出来

											
										
										
											2023-12-12 01:17:21 +08:00
+								            except:
 								                return
 								            doc.write(
-												html群聊导出支持头像和昵称；修复了一些其他问题

											
										
										
											2023-12-17 18:33:06 +08:00
+								                f'''{{ type:34, text:'{audio_path}',is_send:{is_send},avatar_path:'{avatar}',voice_to_text:'{voice_to_text}',timestamp:{timestamp},is_chatroom:{is_chatroom},displayname:'{displayname}'}},'''
-												html语音消息支持导出，如果电脑转过文字那么转的文字也可以显示出来

											
										
										
											2023-12-12 01:17:21 +08:00
+								            )
-												修复找不到wx文件夹的问题#124 #115

											
										
										
											2023-12-13 21:23:43 +08:00
+								        if self.output_type == Output.TXT:
 								            name = '你' if is_send else self.contact.remark
 								            doc.write(
 								                f'''{str_time} {name}\n[语音]\n\n'''
 								            )
-												html语音消息支持导出，如果电脑转过文字那么转的文字也可以显示出来

											
										
										
											2023-12-12 01:17:21 +08:00
-												用户可自定义选择导出HTML的消息类型

											
										
										
											2023-12-10 18:55:17 +08:00
+								    def emoji(self, doc, message):
 								        origin_docx_path = f"{os.path.abspath('.')}/data/聊天记录/{self.contact.remark}"
 								        str_content = message[7]
 								        str_time = message[8]
 								        is_send = message[4]
 								        timestamp = message[5]
-												html群聊导出支持头像和昵称；修复了一些其他问题

											
										
										
											2023-12-17 18:33:06 +08:00
+								        is_chatroom = 1 if self.contact.is_chatroom else 0
 								        if is_chatroom:
 								            avatar = f"./avatar/{message[12].wxid}.png"
 								        else:
-												修复了自己引用页面出问题的bug，修复了单人导出时头像路径错误

											
										
										
											2023-12-17 19:37:16 +08:00
+								            avatar = f"./avatar/{MePC().wxid if is_send else self.contact.wxid}.png"
-												html群聊导出支持头像和昵称；修复了一些其他问题

											
										
										
											2023-12-17 18:33:06 +08:00
+								        if is_chatroom:
 								            if is_send:
 								                displayname = MePC().name
 								            else:
 								                displayname = message[12].remark
 								        else:
 								            displayname = MePC().name if is_send else self.contact.remark
 								        displayname = escape_js_and_html(displayname)
-												支持导出txt

											
										
										
											2023-12-10 19:36:08 +08:00
+								        if self.output_type == Output.HTML:
 								            emoji_path = get_emoji(str_content, thumb=True, output_path=origin_docx_path + '/emoji')
-												处理404 emoji

											
										
										
											2023-12-22 19:22:30 +08:00
+								            emoji_path = './emoji/' + os.path.basename(emoji_path)
-												用户可自定义选择导出HTML的消息类型

											
										
										
											2023-12-10 18:55:17 +08:00
+								            doc.write(
-												html群聊导出支持头像和昵称；修复了一些其他问题

											
										
										
											2023-12-17 18:33:06 +08:00
+								                f'''{{ type:{3}, text: '{emoji_path}',is_send:{is_send},avatar_path:'{avatar}',timestamp:{timestamp},is_chatroom:{is_chatroom},displayname:'{displayname}'}},'''
-												支持导出txt

											
										
										
											2023-12-10 19:36:08 +08:00
+								            )
 								        elif self.output_type == Output.TXT:
 								            name = '你' if is_send else self.contact.remark
 								            doc.write(
 								                f'''{str_time} {name}\n[表情包]\n\n'''
-												用户可自定义选择导出HTML的消息类型

											
										
										
											2023-12-10 18:55:17 +08:00
+								            )
-												修复HTML卡顿的问题

											
										
										
											2023-11-22 00:22:50 +08:00
 								    def wx_file(self, doc, isSend, content, status):
 								        return
 								    def retract_message(self, doc, isSend, content, status):
 								        return
-												修复一些问题

											
										
										
											2023-12-17 13:15:49 +08:00
+								    def refermsg(self, doc, message):
-												支持导出引用消息类型

											
										
										
											2023-12-11 22:49:17 +08:00
+								        """
 								        处理回复消息
 								        @param doc:
 								        @param message:
 								        @return:
 								        """
 								        str_time = message[8]
 								        is_send = message[4]
 								        content = parser_reply(message[11])
 								        refer_msg = content.get('refer')
-												html群聊导出支持头像和昵称；修复了一些其他问题

											
										
										
											2023-12-17 18:33:06 +08:00
+								        timestamp = message[5]
 								        is_chatroom = 1 if self.contact.is_chatroom else 0
 								        if is_chatroom:
 								            avatar = f"./avatar/{message[12].wxid}.png"
 								        else:
-												修复了自己引用页面出问题的bug，修复了单人导出时头像路径错误

											
										
										
											2023-12-17 19:37:16 +08:00
+								            avatar = f"./avatar/{MePC().wxid if is_send else self.contact.wxid}.png"
-												html群聊导出支持头像和昵称；修复了一些其他问题

											
										
										
											2023-12-17 18:33:06 +08:00
+								        if is_chatroom:
 								            if is_send:
 								                displayname = MePC().name
 								            else:
 								                displayname = message[12].remark
 								        else:
 								            displayname = MePC().name if is_send else self.contact.remark
 								        displayname = escape_js_and_html(displayname)
-												支持导出引用消息类型

											
										
										
											2023-12-11 22:49:17 +08:00
+								        if self.output_type == Output.HTML:
-												增加五个数据统计接口

											
										
										
											2023-12-20 18:19:17 +08:00
+								            contentText = escape_js_and_html(content.get('title'))
-												修复引用refertype的bug，美化引用元素，修复引用显示跨页问题

											
										
										
											2023-12-13 13:19:31 +08:00
+								            if refer_msg:
-												增加五个数据统计接口

											
										
										
											2023-12-20 18:19:17 +08:00
+								                referText = f"{escape_js_and_html(refer_msg.get('displayname'))}：{escape_js_and_html(refer_msg.get('content'))}"
-												修复引用refertype的bug，美化引用元素，修复引用显示跨页问题

											
										
										
											2023-12-13 13:19:31 +08:00
+								                doc.write(
-												html群聊导出支持头像和昵称；修复了一些其他问题

											
										
										
											2023-12-17 18:33:06 +08:00
+								                    f'''{{ type:49, text: '{contentText}',is_send:{is_send},sub_type:{content.get('type')},refer_text: '{referText}',avatar_path:'{avatar}',timestamp:{timestamp},is_chatroom:{is_chatroom},displayname:'{displayname}'}},'''
-												修复引用refertype的bug，美化引用元素，修复引用显示跨页问题

											
										
										
											2023-12-13 13:19:31 +08:00
+								                )
 								            else:
 								                doc.write(
-												html群聊导出支持头像和昵称；修复了一些其他问题

											
										
										
											2023-12-17 18:33:06 +08:00
+								                    f'''{{ type:49, text: '{contentText}',is_send:{is_send},sub_type:{content.get('type')},avatar_path:'{avatar}',timestamp:{timestamp},is_chatroom:{is_chatroom},displayname:'{displayname}'}},'''
-												修复引用refertype的bug，美化引用元素，修复引用显示跨页问题

											
										
										
											2023-12-13 13:19:31 +08:00
+								                )
-												修复一些问题

											
										
										
											2023-12-17 13:15:49 +08:00
+								        elif self.output_type == Output.TXT:
-												支持导出引用消息类型

											
										
										
											2023-12-11 22:49:17 +08:00
+								            name = '你' if is_send else self.contact.remark
-												添加ffmpeg

											
										
										
											2023-12-13 20:45:53 +08:00
+								            if refer_msg:
 								                doc.write(
 								                    f'''{str_time} {name}\n{content.get('title')}\n引用:{refer_msg.get('displayname')}:{refer_msg.get('content')}\n\n'''
 								                )
 								            else:
 								                doc.write(
 								                    f'''{str_time} {name}\n{content.get('title')}\n引用:未知\n\n'''
 								                )
-												用户可自定义选择导出HTML的消息类型

											
										
										
											2023-12-10 18:55:17 +08:00
+								    def system_msg(self, doc, message):
 								        str_content = message[7]
 								        is_send = message[4]
-												支持导出txt

											
										
										
											2023-12-10 19:36:08 +08:00
+								        str_time = message[8]
-												html群聊导出支持头像和昵称；修复了一些其他问题

											
										
										
											2023-12-17 18:33:06 +08:00
+								        timestamp = message[5]
 								        is_chatroom = 1 if self.contact.is_chatroom else 0
-												正确解决了一些系统消息还存在xml的问题

											
										
										
											2023-12-17 22:09:44 +08:00
+								        str_content = str_content.replace('<![CDATA[', "").replace(' <a href="weixin://revoke_edit_click">重新编辑</a>]]>', "")
 								        res = findall('(</{0,1}(img|revo|_wc_cus|a).*?>)', str_content)
-												解决了一些系统消息还存在xml的问题

											
										
										
											2023-12-17 21:52:44 +08:00
+								        for xmlstr, b in res:
 								            str_content = str_content.replace(xmlstr, "")
 								        str_content = escape_js_and_html(str_content)
-												支持导出txt

											
										
										
											2023-12-10 19:36:08 +08:00
+								        if self.output_type == Output.HTML:
 								            doc.write(
-												html群聊导出支持头像和昵称；修复了一些其他问题

											
										
										
											2023-12-17 18:33:06 +08:00
+								                f'''{{ type:0, text: '{str_content}',is_send:{is_send},avatar_path:'',timestamp:{timestamp},is_chatroom:{is_chatroom},displayname:''}},'''
-												支持导出txt

											
										
										
											2023-12-10 19:36:08 +08:00
+								            )
 								        elif self.output_type == Output.TXT:
 								            name = '你' if is_send else self.contact.remark
 								            doc.write(
 								                f'''{str_time} {name}\n{str_content}\n\n'''
 								            )
-												修复HTML卡顿的问题

											
										
										
											2023-11-22 00:22:50 +08:00
-												用户可自定义选择导出HTML的消息类型

											
										
										
											2023-12-10 18:55:17 +08:00
+								    def video(self, doc, message):
 								        origin_docx_path = f"{os.path.abspath('.')}/data/聊天记录/{self.contact.remark}"
 								        type_ = message[2]
 								        str_content = message[7]
 								        str_time = message[8]
 								        is_send = message[4]
 								        BytesExtra = message[10]
 								        timestamp = message[5]
-												html群聊导出支持头像和昵称；修复了一些其他问题

											
										
										
											2023-12-17 18:33:06 +08:00
+								        is_chatroom = 1 if self.contact.is_chatroom else 0
 								        if is_chatroom:
 								            avatar = f"./avatar/{message[12].wxid}.png"
 								        else:
-												修复了自己引用页面出问题的bug，修复了单人导出时头像路径错误

											
										
										
											2023-12-17 19:37:16 +08:00
+								            avatar = f"./avatar/{MePC().wxid if is_send else self.contact.wxid}.png"
-												html群聊导出支持头像和昵称；修复了一些其他问题

											
										
										
											2023-12-17 18:33:06 +08:00
+								        if is_chatroom:
 								            if is_send:
 								                displayname = MePC().name
 								            else:
 								                displayname = message[12].remark
 								        else:
 								            displayname = MePC().name if is_send else self.contact.remark
 								        displayname = escape_js_and_html(displayname)
-												支持导出txt

											
										
										
											2023-12-10 19:36:08 +08:00
+								        if self.output_type == Output.HTML:
 								            video_path = hard_link_db.get_video(str_content, BytesExtra, thumb=False)
 								            image_path = hard_link_db.get_video(str_content, BytesExtra, thumb=True)
 								            if video_path is None and image_path is not None:
 								                image_path = path.get_relative_path(image_path, base_path=f'/data/聊天记录/{self.contact.remark}/image')
-												修复一些bug

											
										
										
											2023-12-16 18:00:44 +08:00
+								                try:
-												解决多次解密导致的消息重复的问题

											
										
										
											2023-12-16 20:06:43 +08:00
+								                    # todo 网络图片问题
-												修复一些bug

											
										
										
											2023-12-16 18:00:44 +08:00
+								                    print(origin_docx_path + image_path[1:])
 								                    os.utime(origin_docx_path + image_path[1:], (timestamp, timestamp))
 								                    image_path = image_path.replace('\\', '/')
 								                    # print(f"tohtml:---{image_path}")
-												修改HTML模板

											
										
										
											2023-12-22 21:21:30 +08:00
-												支持导出txt

											
										
										
											2023-12-10 19:36:08 +08:00
+								                    doc.write(
-												html群聊导出支持头像和昵称；修复了一些其他问题

											
										
										
											2023-12-17 18:33:06 +08:00
+								                        f'''{{ type:3, text: '{image_path}',is_send:{is_send},avatar_path:'{avatar}',timestamp:{timestamp},is_chatroom:{is_chatroom},displayname:'{displayname}'}},'''
-												修复一些bug

											
										
										
											2023-12-16 18:00:44 +08:00
+								                    )
 								                except:
 								                    doc.write(
-												html群聊导出支持头像和昵称；修复了一些其他问题

											
										
										
											2023-12-17 18:33:06 +08:00
+								                        f'''{{ type:1, text: '视频丢失',is_send:{is_send},avatar_path:'{avatar}',timestamp:{timestamp},is_chatroom:{is_chatroom},displayname:'{displayname}'}},'''
-												支持导出txt

											
										
										
											2023-12-10 19:36:08 +08:00
+								                    )
 								                return
 								            if video_path is None and image_path is None:
 								                return
 								            video_path = f'{MePC().wx_dir}/{video_path}'
 								            if os.path.exists(video_path):
 								                new_path = origin_docx_path + '/video/' + os.path.basename(video_path)
 								                if not os.path.exists(new_path):
 								                    shutil.copy(video_path, os.path.join(origin_docx_path, 'video'))
-												把视频、音频和图片的“修改时间”属性改为其发送时间，方便在本地筛选观察

											
										
										
											2023-12-13 21:03:03 +08:00
+								                os.utime(new_path, (timestamp, timestamp))
-												支持导出txt

											
										
										
											2023-12-10 19:36:08 +08:00
+								                video_path = f'./video/{os.path.basename(video_path)}'
 								            video_path = video_path.replace('\\', '/')
-												用户可自定义选择导出HTML的消息类型

											
										
										
											2023-12-10 18:55:17 +08:00
+								            doc.write(
-												html群聊导出支持头像和昵称；修复了一些其他问题

											
										
										
											2023-12-17 18:33:06 +08:00
+								                f'''{{ type:{type_}, text: '{video_path}',is_send:{is_send},avatar_path:'{avatar}',timestamp:{timestamp},is_chatroom:{is_chatroom},displayname:'{displayname}'}},'''
-												用户可自定义选择导出HTML的消息类型

											
										
										
											2023-12-10 18:55:17 +08:00
+								            )
-												支持导出txt

											
										
										
											2023-12-10 19:36:08 +08:00
+								        elif self.output_type == Output.TXT:
 								            name = '你' if is_send else self.contact.remark
-												用户可自定义选择导出HTML的消息类型

											
										
										
											2023-12-10 18:55:17 +08:00
+								            doc.write(
-												支持导出txt

											
										
										
											2023-12-10 19:36:08 +08:00
+								                f'''{str_time} {name}\n[视频]\n\n'''
-												用户可自定义选择导出HTML的消息类型

											
										
										
											2023-12-10 18:55:17 +08:00
+								            )
-												修复HTML卡顿的问题

											
										
										
											2023-11-22 00:22:50 +08:00
-												移除pandas

											
										
										
											2023-11-25 00:40:09 +08:00
+								    def to_csv(self):
 								        origin_docx_path = f"{os.path.abspath('.')}/data/聊天记录/{self.contact.remark}"
-												修复目录创建问题

											
										
										
											2023-12-03 00:03:00 +08:00
+								        os.makedirs(origin_docx_path, exist_ok=True)
-												支持导出txt

											
										
										
											2023-12-10 19:36:08 +08:00
+								        filename = f"{os.path.abspath('.')}/data/聊天记录/{self.contact.remark}/{self.contact.remark}_utf8.csv"
-												移除pandas

											
										
										
											2023-11-25 00:40:09 +08:00
+								        # columns = ["用户名", "消息内容", "发送时间", "发送状态", "消息类型", "isSend", "msgId"]
 								        columns = ['localId', 'TalkerId', 'Type', 'SubType',
 								                   'IsSender', 'CreateTime', 'Status', 'StrContent',
 								                   'StrTime']
-												用单例实现数据库操作,弃用全局变量

											
										
										
											2023-12-01 22:37:45 +08:00
+								        messages = msg_db.get_messages(self.contact.wxid)
-												移除pandas

											
										
										
											2023-11-25 00:40:09 +08:00
+								        # 写入CSV文件
 								        with open(filename, mode='w', newline='', encoding='utf-8') as file:
 								            writer = csv.writer(file)
 								            writer.writerow(columns)
 								            # 写入数据
 								            writer.writerows(messages)
 								        self.okSignal.emit('ok')
-												修复HTML卡顿的问题

											
										
										
											2023-11-22 00:22:50 +08:00
+								    def to_html_(self):
 								        origin_docx_path = f"{os.path.abspath('.')}/data/聊天记录/{self.contact.remark}"
-												优化聊天记录文件的存储结构 #81

											
										
										
											2023-12-06 20:50:32 +08:00
+								        makedirs(origin_docx_path)
-												html群聊导出支持头像和昵称；修复了一些其他问题

											
										
										
											2023-12-17 18:33:06 +08:00
+								        if self.contact.is_chatroom:
 								            packagemsg = PackageMsg()
 								            messages = packagemsg.get_package_message_by_wxid(self.contact.wxid)
 								        else:
 								            messages = msg_db.get_messages(self.contact.wxid)
-												修复HTML卡顿的问题

											
										
										
											2023-11-22 00:22:50 +08:00
+								        filename = f"{os.path.abspath('.')}/data/聊天记录/{self.contact.remark}/{self.contact.remark}.html"
-												修改HTML模板

											
										
										
											2023-12-22 21:21:30 +08:00
+								        file = QFile(':/data/template.html')
 								        if file.open(QIODevice.ReadOnly | QIODevice.Text):
 								            stream = QTextStream(file)
 								            stream.setCodec('utf-8')
 								            content = stream.readAll()
 								            file.close()
 								            html_head,html_end = content.split('/*注意看这是分割线*/')
-												修复HTML卡顿的问题

											
										
										
											2023-11-22 00:22:50 +08:00
+								        f = open(filename, 'w', encoding='utf-8')
-												html群聊导出支持头像和昵称；修复了一些其他问题

											
										
										
											2023-12-17 18:33:06 +08:00
+								        f.write(html_head.replace("<title>Chat Records</title>", f"<title>{self.contact.remark}</title>"))
 								        MePC().avatar.save(os.path.join(f"{origin_docx_path}/avatar/{MePC().wxid}.png"))
 								        if self.contact.is_chatroom:
 								            for message in messages:
 								                if message[4]: # is_send
 								                    continue
 								                try:
 								                    chatroom_avatar_path = f"{origin_docx_path}/avatar/{message[12].wxid}.png"
 								                    if not os.path.exists(chatroom_avatar_path):
 								                        message[12].avatar.save(chatroom_avatar_path)
 								                except:
-												修复了已退群的人昵称无法找到导致的闪退问题

											
										
										
											2023-12-22 18:39:30 +08:00
+								                    print(message)
-												html群聊导出支持头像和昵称；修复了一些其他问题

											
										
										
											2023-12-17 18:33:06 +08:00
+								                    pass
 								        else:
 								            self.contact.avatar.save(os.path.join(f"{origin_docx_path}/avatar/{self.contact.wxid}.png"))
-												用户可自定义选择导出HTML的消息类型

											
										
										
											2023-12-10 18:55:17 +08:00
+								        self.rangeSignal.emit(len(messages))
 								        total_steps = len(messages)
 								        for index, message in enumerate(messages):
 								            type_ = message[2]
-												支持导出引用消息类型

											
										
										
											2023-12-11 22:49:17 +08:00
+								            sub_type = message[3]
-												修改HTML模板

											
										
										
											2023-12-22 21:21:30 +08:00
+								            timestamp = message[5]
-												支持导出txt

											
										
										
											2023-12-10 19:36:08 +08:00
+								            self.progressSignal.emit(int((index + 1) / total_steps * 100))
-												修改HTML模板

											
										
										
											2023-12-22 21:21:30 +08:00
+								            if self.is_5_min(timestamp):
 								                str_time = message[8]
 								                f.write(
 								                    f'''{{ type:0, text: '{str_time}',is_send:0,avatar_path:'',timestamp:{timestamp}}},'''
 								                )
-												用户可自定义选择导出HTML的消息类型

											
										
										
											2023-12-10 18:55:17 +08:00
+								            if type_ == 1 and self.message_types.get(type_):
 								                self.text(f, message)
 								            elif type_ == 3 and self.message_types.get(type_):
 								                self.image(f, message)
-												html语音消息支持导出，如果电脑转过文字那么转的文字也可以显示出来

											
										
										
											2023-12-12 01:17:21 +08:00
+								            elif type_ == 34 and self.message_types.get(type_):
 								                self.audio(f, message)
-												用户可自定义选择导出HTML的消息类型

											
										
										
											2023-12-10 18:55:17 +08:00
+								            elif type_ == 43 and self.message_types.get(type_):
 								                self.video(f, message)
 								            elif type_ == 47 and self.message_types.get(type_):
 								                self.emoji(f, message)
 								            elif type_ == 10000 and self.message_types.get(type_):
 								                self.system_msg(f, message)
-												修复引用不能显示的锅

											
										
										
											2023-12-17 18:48:22 +08:00
+								            elif type_ == 49 and sub_type == 57 and self.message_types.get(1):
-												修复一些问题

											
										
										
											2023-12-17 13:15:49 +08:00
+								                self.refermsg(f, message)
-												用户可自定义选择导出HTML的消息类型

											
										
										
											2023-12-10 18:55:17 +08:00
+								        f.write(html_end)
 								        f.close()
 								        self.okSignal.emit(1)
-												支持导出txt

											
										
										
											2023-12-10 19:36:08 +08:00
+								    def to_txt(self):
 								        origin_docx_path = f"{os.path.abspath('.')}/data/聊天记录/{self.contact.remark}"
 								        os.makedirs(origin_docx_path, exist_ok=True)
 								        filename = f"{os.path.abspath('.')}/data/聊天记录/{self.contact.remark}/{self.contact.remark}.txt"
 								        messages = msg_db.get_messages(self.contact.wxid)
 								        total_steps = len(messages)
 								        with open(filename, mode='w', newline='', encoding='utf-8') as f:
 								            for index, message in enumerate(messages):
 								                type_ = message[2]
-												支持导出引用消息类型

											
										
										
											2023-12-11 22:49:17 +08:00
+								                sub_type = message[3]
-												支持导出txt

											
										
										
											2023-12-10 19:36:08 +08:00
+								                self.progressSignal.emit(int((index + 1) / total_steps * 100))
 								                if type_ == 1 and self.message_types.get(type_):
 								                    self.text(f, message)
 								                elif type_ == 3 and self.message_types.get(type_):
 								                    self.image(f, message)
-												修复找不到wx文件夹的问题#124 #115

											
										
										
											2023-12-13 21:23:43 +08:00
+								                elif type_ == 34 and self.message_types.get(type_):
 								                    self.audio(f, message)
-												支持导出txt

											
										
										
											2023-12-10 19:36:08 +08:00
+								                elif type_ == 43 and self.message_types.get(type_):
 								                    self.video(f, message)
 								                elif type_ == 47 and self.message_types.get(type_):
 								                    self.emoji(f, message)
 								                elif type_ == 10000 and self.message_types.get(type_):
 								                    self.system_msg(f, message)
-												支持导出引用消息类型

											
										
										
											2023-12-11 22:49:17 +08:00
+								                elif type_ == 49 and sub_type == 57:
 								                    self.refermsg(f, message)
-												支持导出txt

											
										
										
											2023-12-10 19:36:08 +08:00
+								        self.okSignal.emit(1)
-												修复一些问题

											
										
										
											2023-12-17 13:15:49 +08:00
-												用户可自定义选择导出HTML的消息类型

											
										
										
											2023-12-10 18:55:17 +08:00
+								    def run(self):
 								        if self.output_type == Output.DOCX:
 								            return
 								        elif self.output_type == Output.CSV:
 								            self.to_csv()
 								        elif self.output_type == Output.HTML:
 								            self.to_html_()
 								        elif self.output_type == Output.CSV_ALL:
 								            self.to_csv_all()
-												支持导出txt

											
										
										
											2023-12-10 19:36:08 +08:00
+								        elif self.output_type == Output.TXT:
 								            self.to_txt()
-												用户可自定义选择导出HTML的消息类型

											
										
										
											2023-12-10 18:55:17 +08:00
 								    def cancel(self):
-												修改HTML模板

											
										
										
											2023-12-22 21:21:30 +08:00
+								        self.requestInterruption()