开发数据管理软件以弥合数据库与数据科学之间

日博体育发布于 |  2020-07-21 14:17 |  浏览:122

大多数数据科学家使用诸如R,Python和C/C++之类的分析工具进行研究。这些工具很难与当前的数据库系统集成,从而导致数据分析缓慢而麻烦。北京软件开发公司:数据科学家选择通过开发​​一系列数据管理替代方案来重塑数据库系统,这些替代方案可以执行与传统数据库管理系统相似的任务,日博体育但是存在许多数十年前在数据库领域解决的问题。

数据库研究界在开发功能强大的数据库引擎方面取得了长足的进步,该引擎可进行有效的分析查询处理。软件开发公司尝试将数据库科学中的这些创新与数据科学家最常使用的分析工具相结合。北京软件外包公司:我们研究了如何促进分析工具与关系数据库管理系统的高效,轻松集成。

软件公司:我们将研究重点放在数据库-客户端集成的三种主要方法上:客户端-服务器连接,数据库内处理以及将数据库嵌入客户端应用程序中。对于每种方法,他研究了现有数据库系统中的实现,并评估了它们对于数据科学中常见的大型数据集和工作负载的效率。

最终结果是一个名为DuckDB的新数据管理系统,该系统专用于与R和Python(及其他分析工具)进行高效且轻松的集成。该管理系统旨在用作成熟的数据库系统,不仅用于研究目的。在DuckDB中,我们将从研究数据库-客户端集成的所有课程中吸取教训,并创建一个易于使用且高效的嵌入式数据库。北京软件外包公司将继续担任CWI的博士后,在那里他将继续开发DuckDB。