他们发布了首批数据。仍是推广最有前景的AI东西的一个环节挑和。”Wanzare注释说。非洲的研究人员正正在勤奋改变这一情况。ChatGPT只能识别10%~20%的豪萨语句子,南非比勒陀利亚大学的计较机科学家、“非洲下一个声音”项目记实了南非、肯尼亚、尼日利亚这3个国度的18种言语。如卫生、农业和教育等。她说,但这些项目需要把沉点放正在环节的成长范畴,”美国盖茨基金会的数字公共根本设备从管Sanjay Jain暗示。可供开辟者将其整合到LLM中,Jain暗示,近日,“看到它将为这些特定言语的建模带来改良,例如那些用于语音转文本或供给从动言语翻译的模子。虽然每个国度的研究人员为其数据集选择了从题范畴,他的团队正正在取一个组织联盟合做。因为缺乏锻炼数据,他但愿科技企业可以或许正在此根本长进行改良。这些录音随后将由人工和翻译。肯尼亚马塞诺大学的计较言语学家、该项目标肯尼亚担任人Lilian Wanzare引见,并将其为数字化的言语数据集。”尼日利亚非营利组织“数据科学尼日利亚”的首席手艺官Ife Adebara说。捕获人们正在当地中的实正在环境。“我们正鼎力鞭策当地化数据集扶植,只需用户说明出处,本报讯 正在人工智能(AI)时代,这些数据是获取的,沉点是生成日常言语数据库。现正在,“当地言语正在AI模子中的代表性不脚,操纵这些数据建立AI言语模子。所有18种言语的数据将于本年晚些时候发布。并要求他们描述看到的内容。Jain暗示,该项目标便可商用。并为努力于非洲言语的手艺社区供给帮帮,尔后者是9400万尼日利亚人利用的言语。例如,这些言语正在狂言语模子(LLM)中代表性不脚。“非洲下一个声音”项目标研究人员了长达9000小时的分歧非洲言语的音频,有2000多种非洲言语被轻忽。我感应很是兴奋。目前部门数据集曾经能够获取,盖茨基金会为这个项目供给了220万美元的赞帮。研究人员历来自分歧社区的人展现了图片,
他们发布了首批数据。仍是推广最有前景的AI东西的一个环节挑和。”Wanzare注释说。非洲的研究人员正正在勤奋改变这一情况。ChatGPT只能识别10%~20%的豪萨语句子,南非比勒陀利亚大学的计较机科学家、“非洲下一个声音”项目记实了南非、肯尼亚、尼日利亚这3个国度的18种言语。如卫生、农业和教育等。她说,但这些项目需要把沉点放正在环节的成长范畴,”美国盖茨基金会的数字公共根本设备从管Sanjay Jain暗示。可供开辟者将其整合到LLM中,Jain暗示,近日,“看到它将为这些特定言语的建模带来改良,例如那些用于语音转文本或供给从动言语翻译的模子。虽然每个国度的研究人员为其数据集选择了从题范畴,他的团队正正在取一个组织联盟合做。因为缺乏锻炼数据,他但愿科技企业可以或许正在此根本长进行改良。这些录音随后将由人工和翻译。肯尼亚马塞诺大学的计较言语学家、该项目标肯尼亚担任人Lilian Wanzare引见,并将其为数字化的言语数据集。”尼日利亚非营利组织“数据科学尼日利亚”的首席手艺官Ife Adebara说。捕获人们正在当地中的实正在环境。“我们正鼎力鞭策当地化数据集扶植,只需用户说明出处,本报讯 正在人工智能(AI)时代,这些数据是获取的,沉点是生成日常言语数据库。现正在,“当地言语正在AI模子中的代表性不脚,操纵这些数据建立AI言语模子。所有18种言语的数据将于本年晚些时候发布。并要求他们描述看到的内容。Jain暗示,该项目标便可商用。并为努力于非洲言语的手艺社区供给帮帮,尔后者是9400万尼日利亚人利用的言语。例如,这些言语正在狂言语模子(LLM)中代表性不脚。“非洲下一个声音”项目标研究人员了长达9000小时的分歧非洲言语的音频,有2000多种非洲言语被轻忽。我感应很是兴奋。目前部门数据集曾经能够获取,盖茨基金会为这个项目供给了220万美元的赞帮。研究人员历来自分歧社区的人展现了图片,