数据繁忙人士的备忘单 - 彭博社
bloomberg
电子数据库将世界置于您的指尖。问题是,即使是15分钟的搜索也可能让您在下载到计算机上的文档中挖掘数小时。被宣传的信息超级高速公路可能会使情况变得更糟:旅行者可能会在多媒体暴风雪中迷失。
为了帮助筛选这场雪崩,东芝公司的研究人员创建了一种文本检索系统,他们表示该系统可以消化长文档,并以简单、语法正确的中文句子生成摘要。如果摘要不够充分,客户可以告诉系统重新生成,例如请求更多的技术细节或市场统计数据。
东芝的研究人员认为,商业化该系统还需要两年时间,该系统运行在基于Unix的工作站上。首先,他们必须教系统搜索完整的句子,而不仅仅是关键词。其次,他们需要加快文档分析的速度,这可能需要数小时的计算时间。最后,他们需要将软件转换为英语,因为世界上绝大多数数据库客户居住在美国,而不是日本。