今天给大家分享一下扣子如何基于rog技术实现产品资料问答。首先我们来看一个效果,就比如说我们现在实现了这么一个功能,现在公司内部有很多知识库文档,有讲什么产品的一些基本信息。比如说我们要做一个APP,那做一个是一个这样的一个办公助手,那涉及到这个助手的一些使用,比如说OA的一些资料填报,还有请假的审批,包括一些办入职的一些流程,还有包括公司内部的一些流程,怎么样来操作这个平台,就产品信息的一些知识库,还有包括一些公司内部一些网络环境的配置,包括一些公司内部一些升职加薪,一些人事,福利制度等等,比如说我们要做这样一个知识库,让我们的员工,大家可以通过跟AI对话的方式,快速的知道公司的一些员工制度,福利制度等等。
我们如果说要做这么一个功能的话,怎么来实现,我们想希望可以去有一个地方可以去加各种各样的知识库,包括一些资料。还有的话就是一些对话的时候,大家可以看到就是一些功能,一些我们可以推荐一些问题,比如说这个休假制度,很多员工比较关心,还有一些调休,包括一些年终奖等等的一些制度。在我们以对话的方式给AI去沟通。那前提的话我们要把这些数据首先要存到这个AI的这么一个知识库里面去,所以说整个一个实现的话,我们给大家讲一下这个怎么来做。背景的话就是比如说我们现在要做一些办公平台是吧?这个办公平台我们现在需要有这么一个知识库,重点内容就是这个知识库,这之后的话就是它提供了简单易用的一种方式,就是可以支持各种各样数据库这个知识库。比如说我们在扣子里面,我们去新增一个知识库的话,它支持各种各样的格式,比如什么本地文档,还有一些在线的一个地址,我们等一下都会带它来操作。
知识库它其实也分很多种。首先从大类上来看,有文本的这个知识库,有表格的知识库,有图片的这个知识库。文本的这个知识库的话就是我们可以上传本地文档,什么PDFTXT word文档、markdown是吧?在线文档就是网页,包括飞书的一些具体的一些文档的一些细节。然后包括一些什么公众号,奶粉是国外的一个文档平台,包括自定义内容我们都可以去加,这个都没什么关系。好,这个就是飞书的这么一个扣子的一个知识库的这么一个功能。
好,然后我们来再来说这个rog技术,我们今天主要给大家讲的就是整个扣子跟rog技术的一个结合。Rog的话是目前大模型时代,就是开发整个一个在做一些问答的时候,可以基于整个知识库去做一些检索,去提高回复的一个内容质量。因为大模型大家知道都是经过预训练的,它里面的知识库的都是静态。所以大模型发布的时候一般会有一个知识的截止时间,比如说他是去年3月份发布的那后面的最新的一些数据的话,他可能就不知道了。你问他最新的新闻天气的话,他是不知道的。那如何才能让他知道呢?还有一个场景就是公司内部的一些文档,就是你行业的这个知识动态,就是你垂直领域的一些知识的话,AI它其实也是不知道的,只有你自己知道你们公司的一些情况,你有这些文档。那现在怎么想把这个文档跟AI做一个结合,然后落地到我们具体的业务场景里面去,这个怎么来实现呢?
就要用到今天我们重点要介绍的这个rag。Rug的话是有一个几个英文单词的一个缩写,它的叫relevant argument generation,叫检索增强生成。检索的话指的是我们把这些数据的话会存在一个线上数据库里面去。随着向量数据库的话,意味着我们检索的时候会去做向量的一个相似度匹配。我给大家举个例子,什么叫向量相似度匹配呢?比如说我们现在有个坐标,有个X坐标,还有一个Y坐标。那么这两个坐标,比如说现在这个点叫A点,这个点叫B点。那大家可以把一段每一段的文本,就是我们刚刚一些文章的内容,每一个文本每一段,大家可以把它比作一个向量坐标,我们现在是一个简单的XY轴的一个二维坐标。
如果说你用的是比如说你用的是那个ChatGPT的那个ebing模型,它会它的功能是把文本转换成向量。那个模型的话,它的一个维度的话是1536维。这个高维的话维度越高意味着他的这个文本里面的特征值被提取的越丰富。特征值越丰富的话就意味着这个文本的特征它的一个特性就比较多。如果说比如说1300 536位整个维度在整个坐标上都是相互匹配的话,就意味着它的语义是相似的,意味着咱们检索到了内容相同的,或者叫语义接近的内容。
那这个逻辑的话就是什么呢?就是我们现在可以根据这两个点计算它的一个什么呢?有两种方式去计算它的一个相似度。一个叫欧式距离,就直接一条直线连起来计算A点到B点的一个直线距离,这个叫欧式距离,这是一种算法,计算相似的。还有一种算法叫余弦相似度,就是看到这个夹角,它们夹角的这个度数是不是接近于一,接近于一的话意味着它是相似的,一般就是这两种算法。
所以说整个检索的意思就是我们拿着用户,比如说我去问那个智能体这个请假制度有哪一些,他会拿着你这句话去那个知识库里面去搜。比如说公司有什么各种各样的请假,什么病假,调休假、年假,各种各样的假,他会帮你去搜,搜索到跟你这个问题比较相似的这个内容。然后把它找到之后干嘛呢?把它丢给大模型,让他去做总结归纳,所以叫增强生成。增强的意思就是由大模型去帮你做一些什么?总结归纳,让它看上去更加的什么人性化一些。因为你搜索出来的片段的话,它是没有经过梳理的,就跟你们去找资料一样,你找的资料都是散的。那需要有一个总结的人员,把这些资料梳理完之后,最终总结性的归纳去生成这个技术就叫rog技术。
Rag技术其实有两个最关键的内容,叫两个阶段。第一个阶段叫检索阶段。检索阶段的话我们要通过编码的这种方式,把文本转换为向量,去向量做相似度匹配。匹配完之后把内容给输出出来,这个叫检索阶段。生成阶段制的话,我们要检索到这个上下文片段丢给大模型,封装成这个提示词,一起丢给大模型,由大模型帮我去生成文本,这个叫生成阶段。所以说rog技术的话,它是可以很好的解决大模型这个叫胡乱编造的问题的,也就是个幻觉问题,可以抑制大模型的幻觉问题。
扣子知识库的话,它就提供了这么一个功能,就叫做上传到知识库。所以说我们等一下首先会带大家去把一些文档上传到数那个线上数据库里面去。然后一步步的去把这个资料问答,就产品资料问答整体给实现。Rag的应用的高频场景,比如说还包括虚拟人物生成?产品资料问答,包括一些QA问答,还有一些专业领域的知识问答等等,这些都可以基于这个rog技术去做。
好,接下来就是我们从0到1去做一个搭建。首先这个产品资料问答场景是什么呢?场景就是我们公司内部有很多这个资料?包括我们要做C端的产品,用户不想去看什么说明书了是吧?太太麻烦了,太厚了,他想直接问问题,给结果就完事儿了。我们如果说想做这么一个场景应用的话,AAI结合rug的话就很好去做实现。
包括目标群体的话,就是它不仅限于这个消费者,产品销售人员也可以用这套系统,客服人员也可以用,就是想要了解产品的人,加速决策效率的人都可以去用这个资料问答这种题。所以说它主要包含几块,一块是这个潜在消费者,他想要了解产品的特性,现有用户他也想知道这个产品怎么来用,客服人员的话可以把这个系统当做辅助工具,去提高自己的工作效率跟效果。然后市场研究人员的话就是他能够通过问答内容了解消费者关注的焦点和产品的一些常见疑问,辅助产品去改进跟市场定位,这个是目标权利。
然后市场价值的话就是简单,用户只需要我简单的问答就可以了。就问问一个问题,比如说我问他扣子一些常见的一些问题的话,直接就给我结果了。就很简单,就不需要我看一堆堆的资料。
然后数据的话是实时更新的,就是我们企业内部公司也在发展,行业也在变化,公司的业务也在不断的更新跟优化。企业也会不断的去更新资料。这个时候我们需要保证用户可以获得最准确和最新的一些信息,然后这个也可以去节省一些资源,就是客服人员的压力没那么大了,以前可能很多依赖于人的,那现在可以让AI引入进来,可以解决前置的一些问题。除非有些特别复杂的问题,需要人为的沟通,电话沟通以外,大部分工作都可以交给AI去完成。这样的话用户的满意度和品牌形象的话就可以得到提升。
那这些产品知识一般怎么来搜集呢?首先我们要搭建这个产品资料问答知识库的时候,你要有各种搜集资料的方式。比如说官方资料,比如说我们官方提供的PDF word文档?这是一个很好的渠道。然后新闻报道,媒体发布,比如说看一些文章,发新闻稿等等,都是了解产品最新动态的好资料。还有包括一些社交媒体、论坛、用户评价、讨论?经常会出现在社交媒体还有板块上面,这是也是一个比较重要的一个渠道,专业评测,专业人士的一些深度评测对比分析,还有线上商城的产品描述跟用户评论,销售平台等等描述等等说还有包括一些云服务软件,社区API文档、在线教程都是重要的信息渠道,所以到这些资料之后,我们都要通过知识库的方式把这些东西打包,做一个总结归纳处理。
好,那这时候的话,其实我们这么一个智能体的话,它也是需要一个提示词的。就是你要做一个产品问答的机器人,他是要有一个提示词的。比如说你是某某某产品的问答小助手,能够精准的理解用户的问题。从你的知识库里面搜索相关的问题,进一步生成给用户答复?所以说这个里面他就重点提到了,从你的知识库里面去检索,然后进一步生成。这个一句话提到的就是rock,整个一个过程就是rog技术。
然后技能有几步,首先第一步问题理解跟检索,首先要理解你这个?然后去检索相关的内容,这是第一个技能。第二个技能就是回答生成,基于检索到的内容,为用户生成准确简洁的一个回答,这个是最关键的。然后就是约束,仅回答与产品相关的问题,不回答无关话题,也就是你不要超纲了,只回答产品问题就可以了,尽量使用简洁清晰的语言来回答用户的问题。整个回答过程中始终以用户的需求为中心,就一定要搞明白,就前面为什么提到这个用问题理解,就是要搞清楚,你不要把这个说偏了是吧?一定要准确理解。
好了,我们接下来以一款叫飞联产品助手的一个办公安全产品为例,来一步步的去演示这个怎么来搭建。假设这个产品的话是新一代的数字化办公基建,帮助企业员工随时安全的去连接内部网络跟应用,那这个里面就会有一些使用文档。首先第一步带大家去做的就是把这个知识库给建设起来,要去收集数据,我们要确认数据。比如说我们数据源可能来自于各种各样的,有什么一些word文档,也有一些网页的一些文档,包括在线收集等等,还有一些表格,各种各样的文档都有,那我们现在就开始来搜集。
首先比如说现在有一个线上文档,有飞廉的这个官方文档描述,我们现在把这个东西给它采集起来,丢到我们那个知识库里面去,怎么来弄呢?来来来操作一下。大家在登录到这个扣子的后台有一个资源库,资源库这里我们点右上角有一个叫知识库。知识库我们这里写着,比如说我们最开始要去收集一个什么呢?叫管理员手册是吧?叫使用指导。管理员手册。
我们现在需要有一个在线文档,然后文档完了之后我们选的是在线数据。在线数据的话这里大家看啊,我们现在是一个UIL来选择在线数据,然后创建并完成并导入。导入完成之后,这里我们选这个简单一点,我们去选自动采集或者手动采集就可以了。我简单点就选自动采集,我们直接把这个UIL加上去,然后点确认确认这里大家看到它就是可以开始去什么呢?
新增UIL。如果你手动的话,它会让你装一个插件去手动勾选一些那个页面,就页面布局。因为我抓数据我可能我只需要这个区域的,我不需要所有区域的。但是你如果说让他自行抓取的话,他可能把左侧的一些菜单什么都给他抓进来了。所以说这个因为我这里为了演示效果,我就先用自动的,这样简单一些。我手动大家需要去框选那个去你看有一个框选选区域,就是我只想抓某个区域的内容,你就用手动的,这个看大家自己的一个需求了,然后这个就稍微快一些,然后大家看我这里就完成了。
这里就默认的,默认的就是咱们去分段就可以了,就是用字段的切分策略。当然你也可以手动的自定义去加一些换行符。自定义一般是在用这些文档的时候,网页的话我们选自动清洗就可以了。然后下一步这里可能稍微有些慢,要等个几分钟,然后我们可以点确认,等待慢慢处理中,处理完成之后,这个知识库基本上就可以用了。
大家可以看到我们抓进来的那个知识库,你看管理后台操作指引是不是这个标题?然后什么前置条件,已开通什么什么非典注意事项等等,包括你看这里面的表格什么的,是不是都给你抓进来了。你看虽然有些格式有些错乱,没关系,我们只需要知道里面的那个内容文本就可以了。这个可以交给AI去做总结归纳。即使里面的格式可能会显得有点乱,没关系,它其实主要的就是要这些纯文本内容,因为回答问题的时候他就可以做总结归纳了。
好,这个分那完成了。你看分段怎么分段的呢?大家看分了六个段,大家看有一个区域,这是一段,它有一个边界,这里有个边界,这里是一块,这是第二块。3456大家看总共分了六块,自动分段,它会按照它的一个标准大小去做分段,但你也可以自定义,比如说我现在想分多少段是吧?你可以按照你的要求再去改,这个都没关系,你可以重建。
好,这个就是在线的这个知识库,我们要做的一个配置,两种方式,一种自动一种手动,大家根据自己需要去选择。然后切分完成之后,是在线的文档。然后我刚刚还有一个文档,就是客户端手册是吧?Word文档,客户端手册我们这里复制一下,客户端手册我们在这里资源知识库再新增一个客户端手册。
客户端手册的话,我这里给大家准备了一个叫网络配置的一个最佳实践,就是一些什么VPC网络的配置,一个简单的网络配置,我们这里就选本地文档,然后创建完并导入,然后再看我们把这个文档上传上去,这个文档上传上去,然后下一步,下一步完成之后,按照默认就可以了。然后分段策略大家注意看,我们用换行服务来分段,比如说我们卖2000分个段,就是这个每2000个字符分一段分一段。然后这里下面有一个参数需要注意一下,叫重叠率。重叠率是什么呢?
就是我们现在比如说分段分了,比如说分了三段,分了三段,假设分了三段123,那这个重叠率指的是什么呢?重叠率指的是有10%,就是第一个部分的尾部跟第二个部分的头部,有10%的内容是重复的。为什么要这么去加这个参数呢?因为因为大模型上下文是有token限制的,一旦超过限制的话它会就会截断,也就是说比如说你这个参数超过了2048是吧?超过这个大小的话,整个内容就可能会丢失。
那么怎么防止这个丢失问题呢?你可以做分,就是做重叠,也就是说我这个头部,我这个尾部跟头部这里我把它做一个重叠,让它重复的话意味着这部分内容其实丢掉了。在下一部分内容的开头会接着上面的重复的地方?开始也就是说这个地方可以连接起来,即使你这里没了,我下面也能接起来,这个叫重叠率。有了这个之后我们就可以什么呢?防止上下文出现一些丢失,就是为了避免这个问题。
所以说这个重叠率越高的话,其实也会有问题。因为重叠率很高会导致一些空间浪费,对不对?所以说这个大家需要根据实际情况去配置,一般20%到10%就差不多了。具体大家怎么去配,根据具体的一个情况,然后完成之后我们点这个下一步,同样的这里就分段是吧?
那2000个字符去分段,大家看这里就他分了一些这个情况正在处理,下一步,然后让他先处理着,这是一种情况。然后还有一种情况就是表格,表格的一些数据,就是这个常见问题表格,我们要这种文档也得加给它加进去。这个知识库的话,我们同样的在刚刚那个地方,资源库知识库,我们叫常见问题表格是吧?表格注意我们就要我们这里要选表格格式,然后同样的这个完成创建。
好,大家看我们那个表格,我是准备了一些扣子的一些相关问题的一些表格,看看这个问题,我们把它拖拽进来,小助手问题下一步,然后这个就是把行列建索引。建索引的意思就是我们后面可以根据这些索引去做快速的一些搜索。就比如说我想搜用户问题,我就直接打打用户问题去搜就可以了。根据这些索引的话,我可以快速检索到。然后下一步大家看你看索引相当于他帮我们建立了各种各样索引,加速这个搜索。下一步也在处理中等它完成。这个就是表格的这个知识库,但大家如果说你有图片的话,你还可以加第三种类型,叫图片类型。
这种场景的话一般是做那个文案生成,比如说你要做一些情感聊天机器人,今天聊天天机器人里面有一个东西叫虚拟人设,就是你跟那个虚拟人去聊天的时候,你希望他发一个自拍过来,那这个里面就得用图片的这个知识库,要存储他的一个本人头像,他会从这个知识库里面去抓取,这种场景用的比较多。比如还会有一些生成文案,比如说有些产品图片,大家是可以结合这个产品知识库去就这个照片知识库去做一些处理的,这个也是一个常见的一个案例,所以说这个大家根据不同的场景去选就可以了,包括你像通过一些API抓你公司内部的一些数据的话,其实都是OK的。
好,这个就是知识库的一个玩法,大家可以去根据你的需求建不同的知识库。好,这些数据那我们就认为基本上都有了,还有一个什么价格的,这个我们就不管了,反正就是大家有什么文档,你要做一个应用的话,你会把这个文档以各种不同的形式去创建知识库。我们目前就几类,产品信息知识库就是用来去收集线上产品的技术信息的,产品文档知识库就是保存产品的使用文档,功能等等介绍然后问题排查我们就放一个表格,常见问题一些排查,整个一个逻辑。好,然后就是手机手动采集网页数据,这个的话大家就是选在线采集,我给他演示一下。比如说文本,你叫直接在刚刚那个地方,就是那个管理员手册这里,大家可以选这个地方,我们可以调整自定义。行,看看能不能改,查看后调整位置,不能改没关系,我们重新新增一个工作流。知识库来看本地文档,我们就做一个手动配置这个知识库选本地文档。然后我们依旧是啊我们想选在线,我想选一个在线,那我把它删掉。
删除掉,然后创建一个知识库,然后叫收。获取在线知识库,这里我们选在线数据,然后创建完并导入,然后手动采集。当然首先这里要装一个插件,你要装把这个插件给装上去才行。要chrome把它下一个插件,下完之后你要把它加进来,加进来之后点权限授予点允许。
然后这里大家看你去输入一个UIL,比如说我们就选这个,在线文档一个价格的是吧?把这个选进来来确定,它这里会跳出一个框框,大家看啊就是你看我们选择一个区域,比如说cap list,大家看你看是不是有一个这个是吧?选这么一个区域,那我们希望是这个格式,那你可以选这个,比如取消用这个,你看这样也可以的。还有俩,一个是list,一个是那个列表,那我们选那个list,把这个大概它就是可以根据你页面的一个元素去帮你框选。比如我们就这么选,然后点什么呢?文本完成并采集,大家看是不是就已经在处理了,然后看下一步,自动,确定。
大家看这个就是手动抓取,它用了一个插件叫cos scp,就是他会帮你去抓数据,就这么个意思。所以这两种方式大家都可以去研究一下。如果说你想要把内容准确的话,你用手动的会好一些。所以这个就是这个手动的去抓取的这种方式。
好,然后这些数据弄好之后的话,接下来大家需要做的就是去整那个智能体的,就是你要把智能体配好。智能体配置的话。我们刚刚那个抓取分段也有那么一些问题,只获取了一块内容。刚刚那个抓取稍微有那么一些问题,可能那个选择没有配置对,这个抓取的时候那个位置记得选对。没关系,先不管这个,我们先去搭支撑体。
好,有了这知识库之后干嘛呢?大概创建一个智能体,比如说这个叫。办公。答疑助手,就是我们现在要与你一个办公产品,现在要答疑,我们建一个智能体。好,智能体的话现在就是最关键的我们要写提示词,就是我整个问答的一个逻辑是什么,所以说大家把这个提示词复制一下,粘贴到这个地方来。首先我们要做一个角色的定义,比如说你是某某产品的一个问答小助手,能够精准的回答用户的问题,从知识库里面抓取出来相关信息,进一步的生成用户去回复。然后技能的话就是问题理解跟检索问答生成,然后什么什么只回答相关的问题就可以了。
好,现在最关键的就是我们要把知识库加进来。知识库加进来我给大家看一下,在这个文本里面,首先文本知识库?选文本之后我们刚刚有几个,一个是管理员手册加进去?然后客户端手册加进去,还有一个手动获取的知识库,我们也给它加进去,这个都是文本的,然后还有一个表格的,对不对?表格的话大家点这个表格,就是常见问题表格,这是我刚刚创建的是吧?来把它加进去,这个就有了。
然后大家如果说你有图片的话,你也可以加入图片。这个是图片是我之前搭建的一个做智能聊天的一个那个啊,其实你也可以把它加进去,就是你你要查询它的图片内容?你看我配了一些虚拟人的头像,这个大家也可以加进去的。没关系的,那你问他相关的问题的时候,他也会从这个里面选一些照片给你反馈。咱们等下来测试一下。
好,现在有了这个东西之后,接下来大家看啊,那就有意思的地方就来了,就是我们现在在提问了。比如说我现在想随便问一个问题,我想问一个这个看起来不是很方便,我们打开这个,比如说叫应用管理。我们说应用管理它是用来干嘛的?就问他一个简单问题,看答答的对不对。来你想那直接来问一下应用管理这个功能。作用是什么?来我们就问他问题,看一下他,你看已经在搜索知识库了是吧?
来看到正在搜索,搜索到的内容是什么呢?你看应用管理,企业办公所需的自建应用跟咱们这个结果描述的是不是准确的。什么企业自建应用,第三方应用均可记录,什么办理破产。大家看这个结果,你看上面搜出来的是一堆那些格式可能会比较混乱的内容,对不对?下面大家看啊,他给你的结果是比较通畅的,基本上跟这句话是一基本上可以对得上了是吧?都是一个标准回答了。这个就是智能体的强大之处,它可以帮你去梳理它的一些细节,就是一些语义通畅的。
你看上面那个其实是什么呢?就是rug里面的一个检索,给大家看第一个技能叫问题理解跟检索。这个地方就是检索的一个过程。首先他把这一堆东西给你去那个知识库里面的那些东西做一个匹配。在这个地方我给大家看一下,资源库里面知识库文本。
大家看到它是去帮你去检索这个知识库,它是用的这个向量去做检索的,就我刚刚提到的那个向量相似度匹配,要么是俞学相似度,要么是这个欧式距离。算出来之后,它会把一些文档文本的片段给你。因为提到应用管理的话,它可能涉及到多个片段。你看应用管理它不能抓出来,其实这个是最准确的。但是这个里面大家看啊,他把IT应用也给你抓出来,因为你提到了应用应用,但是它会有一个什么呢?
有一个得分,大家看这个得分是0.85,这个得分是0.58。从这两个东西大家就可以看得出来,为什么我说那个鱼弦相助,欧式距离,鱼弦相助比如说它接近于一的话,这个完全就是一致的。你看现在得分得到了0.85,说明它的精准度已经非常之高了,很接近了。到0.9的话基本上可以判定为基本上一致了。所以说这个是以无限接近于一的这么一个值,大概率就是余弦相似度给它做出来的评分。但这个评分算法有多种,不一定仅限于余弦相似度,它可以混合多种算法去做一个匹配。
好,也就是说最终会给你说出一个文档片段,但是AI需要做的是根据这段片段干嘛呢?去把这个东西给做一个回答生成,就基于检索到的内容为用户生成准确简洁的问答。这个就是rog技术那个A就后面两个单词a argument是吧?还有一个generation增强生成。增强生成的意思就是把你上面的内容做总结归纳输出,给出一个最终的结果,这个叫内容增强生成,然后这是第一种情况?
搜索文本,比如说我们再让他去搜索表格,表格里面我就问他,这个什么扣子有什么功能复制一下,我问这个问题,拿去检索表格,看他准不准确,来再来走一把。好,大家看看正在搜索,扣子是简化什么什么大模型的。我们看一下大家看他是不是搜的常见问题表格里面去了,是不是没错。常见问题表格是不是都是发表格的数据,但是表格里面数据提到的东西,他问到扣子的一些问题的话,其实也会有很多。你看因为我们问的问题是扣子有什么功能,但是这个片段有很多,你看有说扣子什么什么发布的对吧?
有时候记忆的很多都在说扣子这个得分是0.99分,我认为这个是最有代表性的。还有0.88分的,它排名不一样。你还说了好几个片段,总共说了五个片段出来。但是我只想要一个片段的内容,要有一个最终的结果。所以大家看啊,你看扣子是从简化基于大模型的各类什么boat搭建的,看一下这个结果。大家看是不是我们想要的一个结果就在这里。我们其实想要这个,但是他帮我们找了下面一堆都找出来了,这个是最接近的,这个是最接近的,所以他的得分最高。好,这个就是基于表格的一个输出。
然后的话比如说我们还可以问一些图片的,比如说我看一下行不行,可能这个问题不一定能答复,因为我们下面写了仅回答与产品相关的,发一下产品。产品什么呢?代言人头像,我看一下能不能匹配到这个照片里面的知识库,看一下它有没有这么智能,应该是可以学习里面不包括这个是吧?我们在约束这里写一下。产品代言人,这个头像可以获取内容。大家可以看啊,就是这个里面什么呢?我可以去获取照片知识库里面的内容,就是我现在想用这个知识库里面的内容是吧?我这里你可以特殊的跟大家说一下,我发一下做产品代言人的头像。
它还是不行,这个可能需要特别的去标识一下。这个知识库是不是可能要改一下罗下,改成罗下看一下照片知识库图像。
对。随机一张。照片,我让他随机取一张看行不行看一下他写的这么明确,他能不能知道。只能回答是吧,把这个去掉看一下,不让他说无关的。把那个限制去掉试一下。
已经学习的这个知识库里面不包含这个,是吧?还不一定能取得出来是吧?我看一下,实在不行就算了,因为它这个我们因为给产品做了一些定义,知识库中检索。文本知识库、表格、照片。我让他都去搜一下。
无法生成用户的建议,这个还不行,因为它这个技能一定要从文本里面去搜,是吧?没关系,出不来就算了,没关系。可能是这个照片知识库需要单独去配一下,这个大家也可以去研究一下,应该是要改一下这个提示词,然后去做一些调整就可以了。
原则上是没什么问题的,因为我之前搭的那个智能就是感情,就是陪伴是吧?那个机器人的话它是可以做这个事情。好,比如说还有一种场景,我现在要问多个问题,我想让他去搜索多个知识库。比如说我都问一下应用管理,还有那个网络的问题我也问一下,就是一些这个比如说我找一个。
比如说VPN连接怎么配置,我问他三个问题。钩子有什么功能啊?我想问你。三个?你把三个问题都打在这里,一扣子有什么功能?然后第二个问题,让他同时去搜三个文档,然后3VPN连接怎么配置,你多问他几个问题。大概你看他知识库是不是都去搜了,他都去搜了,是不是?你看他搜索了几个知识库,有什么常见问题,后台指引等等的。
但是那个VPN那个问题,就是网络配置那个问题,他好像没把它弄进来。他学习这个地方好像是有点问题的。但没关系,因为他这个主要是做企业办公的问答,所以那个知识库可能是因为配置名称方面的一些命名不是很符合规范,所以说它那没匹配出来,也就是说这个里面大家可以去做各种各样的一些设定,然后去看一下这个效果。