从智能文档搜索到精准的自然语言处理,Amazon Kendra为企业提供了一个强大的解决方案,帮助我们突破传统搜索引擎的局限,快速实现信息的高效整合与检索,接下来让我们一起探索Amazon Kendra如何成为工作中的得力助手,提升生产力。
目录
初识Amazon Kendra
亚马逊云科技账号注册
使用Amazon Kendra
写在最后
初识Amazon Kendra
Amazon Kendra:是由亚马逊推出的一款基于人工智能的智能搜索服务,它专为企业设计旨在帮助组织更高效地从大量数据中提取相关信息,通过自然语言处理(NLP)技术,Amazon Kendra能够理解用户查询的意图并从企业的不同数据源中快速精准地检索出相关答案。
与传统的搜索引擎不同,Amazon Kendra能够处理多种格式的文件和数据源,包括文档、电子邮件、数据库、网站内容等。它支持多语言并可以通过与其他亚马逊云科技服务的集成,进一步提升搜索的深度和精度,其优势在于其智能化的搜索能力,不仅能根据关键词进行匹配,还能理解上下文,提高检索的准确度,从而帮助企业提高工作效率、加快决策速度,并优化知识管理流程,我们可以来到亚马逊云科技的 亚马逊云科技 可以看到,亚马逊云科技提供了很多的云服务内容,这里我们可以看到今天博主讲解的Elastic Load Balancing也赫然其中:
作为一款智能搜索服务的Amazon Kendra特别适用于企业和组织中大量信息的管理与检索。以下是它的几个主要优势:
1)智能化的自然语言处理:Kendra能够理解自然语言查询,不仅仅是基于关键词的匹配,用户可以用日常语言提出问题,Kendra会自动分析上下文提供更相关和精确的答案
2)跨数据源搜索:Kendra能够连接并搜索多个数据源,包括本地存储、云端存储(如Amazon S3)、数据库、企业应用(如SharePoint、Salesforce)等,它能统一检索不同格式和类型的数据帮助用户快速找到所需信息
3)高效的信息提取与整理:通过机器学习技术Kendra能够根据企业的特定需求优化搜索结果,过滤掉无关信息并自动整理出最有价值的内容,从而提升工作效率
4)自定义搜索体验:用户可以根据自己的需求定制Kendra的搜索结果,包括调整排序和优先级以及设置特定的搜索领域,使得结果更贴近实际需求
对于Amazon Kendra博主也不可能讲解的面面俱到,本文博主就举一个简单的示例进行讲解,作为一个抛砖引玉的作用而已,如果有感兴趣的朋友可以随时阅读官方文档,里面也是详细介绍了该服务的具体服务内容及其搭建使用教程,也是能够帮助大家可以对该服务进行快速入门的,可以点击 地址 进行查看:
亚马逊云科技账号注册
如果是第一次使用亚马逊云科技服务的人,第一步肯定是要先注册账号了,这里我将注册账号的流程简单的分享一下给大家,如下所示:
首先打开 亚马逊云科技 亚马逊云科技的 官网 ,然后点击右上角的创建用户按钮,创建新的账户:
然后输入要创建的邮箱地址,然后点击验证邮箱地址,在邮箱中找到验证码然后输入即可:
然后验证通过之后输入一下要创建用户的密码即可,如下所示:
下一步就是输入一些相应的个人信息即可:
然后下一步就是输入自己的账号信息即可,一般都是visa卡就可以:
后面就是要确认一下输入的信息,然后进行一个身份的验证,这里选择短信验证然后地区选择中国就行,下一步就是进行短信验证了:
下一步就是选择自己的支持计划,根据自身情况,个人开发就选择第一个,企业的话选择后面两个都可以:
点击完成注册之后,等待一段时间亚马逊云科技会进行一些验证,验证通过然后我们转到登录页面,输入我们刚才创建好的账户即可,然后就进入到管理控制台进行相关操作,如下控制台我们就可以使用不同的亚马逊云科技提供的各种服务进行使用了:
使用Amazon Kendra
接下来展示如何利用Amazon Kendra开发企业级搜索引擎,我们可以在一个小时内完成新的Amazon Kendra索引的设置而不需要具备深厚的技术知识或丰富的机器学习背景,在创建Amazon Kendra索引之前,我们需要先把文档上传到S3的存储桶里。当数据访问完毕后,就可以将文件加载到存储桶当中进行进一步处理,以下截屏所示为amazon_help_docs文件的内容:
要创建您的第一个Amazon Kendra索引,需要在控制台上选择Services,然后在Machine Learning之下选择Amazon Kendra,如下图所示:
Amazon Kendra主页面中选择Create an Index,在Index details部分的Index name当中输入kendra-blog-index,在Description部分输入My first Kendra index,在IAM role部分选择Create a new role,在Role name部分输入-index-role,在Encryption部分不要选择Use an KMW managed encryption key,在默认情况下数据将使用Amazon Kendra所拥有的密钥进行加密:
关于Amazon Kendra创建的IAM角色的更多详细信息,Amazon Kendra提供两个版本,其中Kendra Enterprise版主要为生产类工作负载提供高可用性服务,Kendra Developer版则适用于构建概念验证与试验,在本文中我们将使用Developer版,在Provisioning editions部分选择Developer edition,选择Create:
索引创建过程最多可能需要30分钟。在创建完成之后将在页面上方看到一条消息提示索引已经成功创建:
数据源是存储文档以进行索引的位置,可以将数据源与Amazon Kendra索引自动同步保证搜索能够正确反映源存储库内的新文档、更新文档或者已删除文档,在继续下一步之前请保证索引已经创建完成且索引状态显示为Active,在kendra-blog-index页面中选择Add data sources:
Amazon Kendra支持六种数据源类型:Amazon S3、SharePoint Online、ServiceNow、OneDrive、Salesforce online以及Amazon RDS,在本文中我们使用Amazon S3。在Amazon S3之下选择Add connector:
在Define attributes部分的Data source name位置输入amazon_help_docs,在Description部分输入亚马逊云科技中的 services documentation,选择Next,如下图所示:
在默认情况下元数据文件将与文档存储在同一目录当中,如果要将这些文件放置在其他文件夹中可以通过添加前缀实现,在Select decryption key部分取消全部勾选项,在Role name部分输入 source-role,在Additional configuration部分可以添加模式以包含或排除某些文件夹或文件,在本文的示例中请直接保留默认值:
在Frequency部分选择Run on demand,这一步定义了数据源与Amazon Kendra索引间的同步频率,对于本次演练可以手动执行同步操作,选择Next,如下图:
在数据源创建完成之后选择Sync now 将文档与Amazon Kendra索引进行同步,整个同步过程的持续时间取决于您索引的文档数量,在本用例中可能需要15分钟之后您应看到一条消息提示您同步成功:
Amazon Kendra能够接受.csv文件当中每一行以问题开头、以答案结尾的内容。具体参见下表:
问题 | 答案 | URL(可选) |
---|---|---|
What is the height of the Space Needle? | 605 feet | https://www.spaceneedle.com/ |
How tall is the Space Needle? | 605 feet | https://www.spaceneedle.com/ |
What is the height of the CN Tower? | 1815 feet | https://www.cntower.ca/ |
How tall is the CN Tower? | 1815 feet | https://www.cntower.ca/ |
下面来看本示例中使用的.csv文件格式:
"How do I sign up for the Amazon Prime free Trial?"," To sign up for the Amazon Prime free trial, your account must have a current, valid credit card. Payment options such as an Amazon.com Corporate Line of Credit, checking accounts, pre-paid credit cards, or gift cards cannot be used. "," https://www.amazon.com/gp/help/customer/display.html/ref=hp_left_v4_sib?ie=UTF8&nodeId=201910190”
在FAQ settings下的S3部分输入 s3://kendrapost-{your account id}/faqs/kendrapost.csv,在IAM role部分选择Create a new role,在Role name部分输入faqs-role(您的角色名称应使用 AmazonKendra-YourRegion-前缀),如下图所示:
选择Add稍等一会儿,直到状态显示为Active:
现在可以在搜索控制台上查看常见问题能否正常起效了,在Indexes之下选择索引,在Data management之下选择Search console,如下图所示:
在搜索字段中,输入 How do I sign up for the Amazon Prime free Trial? 以下截屏所示,为Amazon Kendra将您之前上传的常见问题添加至结果清单,并提供答案与指向该文档的链接:
当然我们也可以在应用程序中通过搜索控制台添加以下组件:
1)Main search page:包含所有组件的主页,可以将应用程序与Amazon Kendra API集成起来
2)Search bar:可在其中输入搜索词并调用搜索功能的组件
3)Results:显示Amazon Kendra结果的组件其中包含三个部分:最佳答案、常见问题解答结果与建议文档
4)Pagination:用于对Amazon Kendra响应结果进行分页的组件
Amazon Kendra还提供可部署在您网站中的源代码。此项功能基于修改后的MIT许可,因此您可以直接套用或者根据实际需求做出修改,以下截屏所示,为即使演示网页运行在计算机本地,其结果仍与我们从Amazon Kendra控制台处获得的完全相同。
写在最后
在信息爆炸的时代,如何快速高效地从海量数据中提取出有价值的知识已经成为企业成功的关键,Amazon Kendra凭借其强大的人工智能和自然语言处理能力,正为企业提供着前所未有的搜索体验。从跨数据源的智能检索,到个性化的结果优化,它不仅提高了工作效率,还为决策者提供了更准确、更有深度的见解。,如果感兴趣的朋友也可以去体验一番:亚马逊云科技 :
与传统的搜索系统相比,Kendra能够理解和响应自然语言查询,意味着用户可以像与人对话一样提出问题,而系统则能准确把握问题的语境,返回最相关的答案。这一创新特性,使得不论是技术人员还是非技术人员,都能享受智能搜索带来的便捷。而Kendra的个性化调整功能,更能根据不同企业的需求,定制最适合的搜索体验,确保每一位用户都能快速找到最具价值的信息:
Amazon Kendra的到来不仅是信息检索的革新更是企业知识管理与数字化转型的加速器,从提升工作效率到促进团队协作,再到加强企业决策能力,它为各行各业提供了无穷的可能,随着智能搜索技术的不断发展,Kendra无疑会继续为全球企业提供更先进、更智能的解决方案,如果决定不再使用服务的话,记得要在控制台关闭服务,以防超过免费额度产生扣费。
亚马逊云科技上海峰会展示云计算前沿技术与实践,涵盖机器学习、大数据等热点。专家现场指导,丰富动手实验,立即注册 开启您的云转型之旅!