基于5G新通话的AI生成式个性化内容增强与实时互动方法及系统与流程

文档序号:37437383发布日期:2024-03-25 19:36阅读:9来源:国知局
基于5G新通话的AI生成式个性化内容增强与实时互动方法及系统与流程

本发明涉及计算机网络传输和媒体资源处理,特别是一种基于5g新通话的ai生成式个性化内容增强与实时互动方法及系统。


背景技术:

1、传统通话是依托无线通信技术实现用户终端之间无线远程实时通话,自其发明以来极大地方便了人们工作及生活中的沟通交流。虽然随着技术的发展,传统通话的相关技术日益成熟,但是现在的传统通话技术仍然存在一些缺点:

2、1、缺乏多媒体支持:传统通话技术通常仅限于文本和音频通信,无法提供多媒体内容的支持。这意味着用户无法以更富多样性的方式表达自己,如通过图像、视频或其他多媒体元素。

3、2、受限的互动性:传统通话技术通常是单向的或受限于基本的文本和音频互动。这限制了用户在对话中表达自己的方式以及融入更多的上下文信息。

4、3、语境的不连贯性:在传统通话中,特别是在文本通信中,语境的连贯性通常容易中断,因为用户必须手动输入文本,而系统无法主动理解并保持语境的连贯性。

5、4、内容生成的复杂性:在传统通话中,如果用户希望生成特定类型的内容(如图像或视频),他们必须依赖于外部工具或应用程序来创建并共享这些内容,这增加了复杂性和不便。

6、5、缺乏个性化:传统通话技术通常不提供高度个性化的体验,因为它们无法根据用户的需求和偏好实时生成内容。

7、近年来,随着5g网络的普及,通信业务有了创新发展,从通话前的彩铃到通话中新通信业务,充分利用网络资源,丰富了通话中的媒体形式。新通信业务包括通话背景、翻译、屏幕共享、白板等。如何充分利用5g网络的技术优势,以解决上述传统通话的不足,改善通话体验是现在通信技术的重要研究方向之一。


技术实现思路

1、本发明针对上述问题,提供一种基于5g新通话的ai生成式个性化内容增强与实时互动方法,包含以下步骤:

2、s1,用户终端在进行5g新通话前,启动通话应用,在通话系统的用户界面中选择需要的ai大模型,作为通话系统在该用户终端5g新通话中处理其输入内容的调用处理模型;

3、s2,用户终端在5g新通话过程中需要进行实时互动时,通过所述用户界面输入内容;

4、s3,所述通话系统在识别到所述用户终端在5g新通话过程中有输入内容时,调用步骤s1中该用户终端所选择的ai大模型,通过所述ai大模型对所述用户终端的输入内容进行处理并生成相应的互动内容;

5、s4,所述通话系统通过ms媒体服务器将步骤s3中生成的互动内容在所述用户终端的通话界面屏幕上进行实时展示。

6、作为本发明的进一步说明,包含不同种类型的ai大模型,所述ai大模型处理所述输入内容后生成与其自身类型相对应的互动内容。

7、更进一步地,所述ai大模型包括文本生成大模型、音频生成大模型、图像生成大模型和视频生成大模型,其中所述文本生成大模型用于生成文本类型的互动内容,所述音频生成大模型用于生成音频类型的互动内容,所述图像生成大模型用于生成图像类型的互动内容,所述视频生成大模型用于生成视频类型的互动内容。

8、更进一步地,所述输入内容包括文本内容、语音内容或手势内容;所述文本内容包括所述用户终端实时输入的文本信息,所述语音内容包括所述用户终端的语音对话内容,所述手势内容包括在用户终端摄像头前做的手势动作。

9、更进一步地,所述步骤s3中,所述ai大模型根据所述输入内容及其上下文内容实时生成符合语境的互动内容。

10、更进一步地,在所述用户终端的实时互动过程中,所述通话系统检测到所述用户终端新的输入内容时,触发所述ai大模型生成新的互动内容,并在所述用户终端的通话界面屏幕上实时展示更新后的互动内容。

11、更进一步地,所述用户终端结束5g新通话后,所述通话系统将用户终端本次5g新通话过程中生成的互动内容进行存储,以供所述用户终端将存储的互动内容导出为离线文件。

12、另一方面,本发明还提供一种基于5g新通话的ai生成式个性化内容增强与实时互动系统,用于实现上述基于5g新通话的ai生成式个性化内容增强与实时互动方法,具体包括通话系统、ai大模型模块、ms媒体服务器和存储单元;其中,

13、所述通话系统具有通话应用,包含在用户终端上打开进入的用户界面,以使所述用户终端进行模型选择以及输入内容操作;

14、所述ai大模型模块包括若干不同种类型的ai大模型,各ai大模型供所述通话系统在用户终端的5g新通话过程中调用,以实时处理用户终端的输入内容并生成相应的互动内容;

15、所述ms媒体服务器用于提供基本和增强业务中的媒体处理功能,包括将所述互动内容在在所述用户终端的通话界面屏幕上进行实时展示;

16、所述存储单元用于存储户终端的5g新通话过程中生成的互动内容,并提供导出接口以供所述用户终端将存储的互动内容导出为离线文件。

17、本发明的有益效果:

18、本发明通过选择不同类型的ai大模型,用户能够实时生成多媒体内容,以满足对话的语境和上下文需求,具体优点体现在以下几个方面:

19、1.更丰富的通话体验:用户可以选择不同类型的ai大模型,包括文本生成、音频生成、图像生成和视频生成大模型,从而实时生成多媒体内容,这丰富了通话的表达方式,使用户能够以更多样化的方式与对话参与者互动。

20、2.更高度个性化:用户可以根据自己的需求和偏好选择ai大模型,以满足他们特殊性。

21、3.提高对话的有效性:ai大模型可以根据语境和上下文实时生成内容,有助于提高对话的连贯性和有效性,生成的内容更符合对话的要求,有助于更好地沟通和理解。

22、4.多媒体内容支持:用户可以实时生成和展示图像和视频内容,这增加了对话的多媒体丰富性,用户可以在对话中使用手势和其他多媒体元素来更好地传达信息。

23、5.离线内容导出:在通话结束后,用户可以选择将生成的ai生成内容导出为离线文件,以便后续参考、分享或存档,这提供了方便的记录和信息保留功能。

24、6.5g技术的支持:本发明为基于5g新通话的技术,利用高速数据传输和低延迟的特性,确保实时生成和展示多媒体内容的效率和稳定性。



技术特征:

1.一种基于5g新通话的ai生成式个性化内容增强与实时互动方法,其特征在于,包含以下步骤:

2.根据权利要求1所述基于5g新通话的ai生成式个性化内容增强与实时互动方法,其特征在于:包含不同种类型的ai大模型,所述ai大模型处理所述输入内容后生成与其自身类型相对应的互动内容。

3.根据权利要求2所述基于5g新通话的ai生成。式个性化内容增强与实时互动方法,其特征在于:所述ai大模型包括文本生成大模型、音频生成大模型、图像生成大模型和视频生成大模型,其中所述文本生成大模型用于生成文本类型的互动内容,所述音频生成大模型用于生成音频类型的互动内容,所述图像生成大模型用于生成图像类型的互动内容,所述视频生成大模型用于生成视频类型的互动内容。

4.根据权利要求1所述基于5g新通话的ai生成式个性化内容增强与实时互动方法,其特征在于:所述输入内容包括文本内容、语音内容或手势内容;所述文本内容包括所述用户终端实时输入的文本信息,所述语音内容包括所述用户终端的语音对话内容,所述手势内容包括在用户终端摄像头前做的手势动作。

5.根据权利要求1所述基于5g新通话的ai生成式个性化内容增强与实时互动方法,其特征在于:所述步骤s3中,所述ai大模型根据所述输入内容及其上下文内容实时生成符合语境的互动内容。

6.根据权利要求1所述基于5g新通话的ai生成式个性化内容增强与实时互动方法,其特征在于:在所述用户终端的实时互动过程中,所述通话系统检测到所述用户终端新的输入内容时,触发所述ai大模型生成新的互动内容,并在所述用户终端的通话界面屏幕上实时展示更新后的互动内容。

7.根据权利要求1所述基于5g新通话的ai生成式个性化内容增强与实时互动方法,其特征在于:所述用户终端结束5g新通话后,所述通话系统将用户终端本次5g新通话过程中生成的互动内容进行存储,以供所述用户终端将存储的互动内容导出为离线文件。

8.一种基于5g新通话的ai生成式个性化内容增强与实时互动系统,用于实现如权利要求1-7任一所述基于5g新通话的ai生成式个性化内容增强与实时互动方法,其特征在于:包括通话系统、ai大模型模块、ms媒体服务器和存储单元;其中,


技术总结
本发明公开一种基于5G新通话的AI生成式个性化内容增强与实时互动方法及系统,在用户通话过程中,通过选择通话过程中要体验的用以辅助对话的AI大模型的种类,包括文本生成大模型、音频生成大模型、图像生成大模型、视频生成大模型等,然后所选择的大模型将根据用户的输入的文本内容、语音对话内容、手势内容等实时生成符合语境及上下文的文本、音频、图像和视频内容展现在屏幕上,在通话结束后这些AIGC的内容可以导出为离线文件。本发明基于不同类型AI大模型的选择,能够实时生成多媒体内容,以满足对话的语境和上下文需求,给用户提供更丰富的通话体验,能以多种方式表达自己,实现更高度个性化的对话,并在实时通话中支持多媒体内容的生成和展示。

技术研发人员:范娴君,张晶晶,陈家志,乔治,李雪欣,汪秋波,李韩,邹西山,罗岚,弋翔,温雪阳,邓宇翔,罗志亮,陈静娴,陈星
受保护的技术使用者:联通沃音乐文化有限公司
技术研发日:
技术公布日:2024/3/24
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1