专利 对图片或视频进行语音标注的方法及标注后识别的方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211222453.X (22)申请日 2022.10.08 (71)申请人即时匹配（上海）网络科技有限公司地址 200040 上海市静安区延安西路12 9号 22层2207室 (72)发明人聂元正　许正　杨帆　徐良坤　廖慧萍　张诚　黄玉阔　 (74)专利代理机构大连大工智讯专利代理事务所(特殊普通合伙) 2124 4 专利代理师梁左秋 (51)Int.Cl. G06F 40/169(2020.01) G06F 21/60(2013.01) H04L 9/40(2022.01) (54)发明名称对图片或视频进行语音标注的方法及标注后识别的方法 (57)摘要本发明涉及图片和视频标注技术领域，提供一种对图片或视频进行语音标注的方法及标注后识别的方法，所述标注的方法包括：步骤A100，获取用户选取的图片或视频，形成待标注目标；步骤A200，向用户展示标注信息编辑页面，并获取用户在标注信息编辑页面添加的标注信息；所述步骤A200包括以下步骤A202：步骤A202，对用户输入的语音信息进行录音，生成语音标注；并获取用户语音标注的拖动过程，能将语音标注放置在待标注目标的不同位置；步骤A300，计算语音标注的标准坐标值；步骤A400，根据用户输入的标注信息、标注信息的标准坐标值以及待标注目标，生成标注后目标。本发明能够在图片、视频上直接标注语音，并跨平台、跨应用分享。权利要求书2页说明书6页附图4页 CN 115392202 A 2022.11.25 CN 115392202 A 1.一种对图片或视频进行语音标注的方法，其特征在于，包括以下过程：步骤A100，获取用户选取的图片或视频，形成待标注目标；步骤A200，向用户展示标注信息编辑页面，并获取用户在标注信息编辑页面添加的标注信息；其中，所述标注信息包括但不限于文字标注、语音标注、涂鸦标注、马赛克标注中的一种或多种；所述步骤A200包括以下步骤A 202：步骤A202，对用户输入的语音信息进行录音，生成语音标注；并获取用户语音标注的拖动过程，能将语音标注放置在待标注目标的不同位置；步骤A300，计算语音标注的标准坐标值；步骤A400，根据用户输入的标注信息、标注信息的标准坐标值以及待标注目标，生成标注后目标。 2.根据权利要求1所述的对图片或视频进行语音标注的方法，其特征在于，步骤A201，获取用户输入的文字信息、涂鸦标注信息、马赛克标注信息中的一种或多种，并形成新的图片或视频；如果用户未输入文字信息、涂鸦标注信息、马赛克标注信息中的一种或多种，则保留原图片或视频。 3.根据权利要求2所述的对图片或视频进行语音标注的方法，其特征在于，在步骤A202 中，能够将用户输入的语音信息，截取其中一段，再形成语音标注。 4.根据权利要求1或3所述的对图片或视频进行语音标注的方法，其特征在于，在步骤 A300中，包括以下过程：获取语音标注在像素点坐标系的坐标值；然后根据像素点坐标系与原图坐标系的关系，得到语音标注在原图坐标系的坐标值；再根据原图坐标系与标准坐标系的关系，得到语音标注在标准坐标系的坐标值。 5.根据权利要求1或3所述的对图片或视频进行语音标注的方法，其特征在于，在步骤 A400中，针对视频的情况，将语音标注在视频中的时间点以及语音标注的添加时长也加入标注后目标。 6.根据权利要求1或3所述的对图片或视频进行语音标注的方法，其特征在于，在步骤 A400之后，还包括：步骤A5 00，设置标注后目标的分享限制；所述步骤A500包括但不限于以下过程的一种或多种：步骤A501，提示用户是否加密，并获取用户的加密信息；步骤A502，提示用户是否限制播放次数，并获取用户设置的播放次数信息；步骤A503，提示用户是否限制播放人数，并获取用户设置的播放人数信息；步骤A504，提示并获取用户是否选择阅后即焚；步骤A505，提示用户是否展示历史溯源，并获取用户设置的溯源信息。 7.根据权利要求6所述的对图片或视频进行语音标注的方法，其特征在于，在步骤A500 之后，还包括：步骤A6 00，将标注后目标和/或分享限制信息，发送到指定用户或者群组中。 8.一种对标注后图片或视频进行识别的方法，其特征在于，包括以下过程：步骤B100，接收者和/或协作者接收标注后目标；步骤B200，验证标注后目标的分享限制；步骤B300，根据标注后目标，计算出语音标注在接收者或协作者设备的像素点坐标，并权　利　要　求　书 1/2 页 2 CN 115392202 A 2在标注后图片或视频上显示语音标注的播放图标；步骤B400，在接收者或协作者点击播放图标后，播放语音。 9.根据权利要求8所述的对标注后图片或视频进行识别的方法，其特征在于，所述步骤 B200包括以下步骤B201至B20 3：步骤B201，确定标注后目标是否处于加密状态，如果标注后目标处理加密状态，获取并验证接收者或协作者输入的密码；步骤B202，验证标注后目标的播放次数信息、播放人数信息以及是否选择阅后即焚；步骤B203，验证标注后目标是否展示编辑历史。权　利　要　求　书 2/2 页 3 CN 115392202 A 3

专利 对图片或视频进行语音标注的方法及标注后识别的方法

专利对图片或视频进行语音标注的方法及标注后识别的方法