Apache Arrow columnar in-memory format
Apache Arrow columnar in-memory format
Apache Arrow columnar in-memory format
Apache Arrow columnar in-memory format
Apache Arrow columnar in-memory format
Fast, lightweight access to Apache Arrow data.
Apache Arrow columnar in-memory format
Apache Arrow columnar in-memory format
Simple columnar table loader for the Apache Arrow format
Apache Arrow columnar in-memory format
Apache Arrow columnar in-memory format
Apache Arrow columnar in-memory format
Apache Arrow columnar in-memory format
Apache Arrow columnar in-memory format
Apache Arrow columnar in-memory format
Apache Arrow columnar in-memory format
Apache Arrow columnar in-memory format
Data loader for the Apache Arrow format.
A high-performance data table component library for SQLRooms applications. This package provides flexible and feature-rich table components for displaying and interacting with large datasets, with special support for Apache Arrow data structures.
Apache Arrow in WebAssembly
A Fastify plugin for sending and receiving Apache Arrow data
A TypeScript/JavaScript client for Apache Arrow Flight and Flight SQL protocols
VGI (Vector Gateway Interface) — DuckDB extension for extending DuckDB in any language over Apache Arrow IPC. No C++/compilation required.
A TypeScript/JavaScript client for GizmoSQL and Apache Arrow Flight SQL
Arrow Extension for Lance
SpatialBench data generator into Apache Arrow format
Apache Arrow-compatible, Rust-first columnar data library for high-performance computing, native streaming, and embedded workloads. Minimal dependencies, ultra-low-latency access, automatic 64-byte SIMD alignment, and fast compile times. Great for real-time analytics, HPC pipelines, and systems integration.
PyO3 bindings for MinArrow - zero-copy Arrow interop with Python via PyArrow
An Apache Arrow Flight SQL server which proxies requests over ODBC
MongoDB connector that reads and writes data to/from Apache Arrow
A columnar data format that is 100x faster than Parquet for random access.
Arrow scalar type with Ord, Hash, and Eq support
Statistics accumulator for Arrow arrays (min, max, null_count, nan_count)
ADBC FlightSQL driver native library distribution for Rust
High-performance Arrow data stack: columnar storage, zero-copy streaming, and schema codegen
Proc macro to simplify the integration of Arrow Data.
Apache Arrow is a common in-memory columnar data store. It's useful to share and process large data efficiently.
Apache Arrowが解決したい問題、設計方針、速さの秘密、現在できること、今後できるようになることなど、Apache Arrowを知らない人でもApache Arrowのことがわかるようになる説明をします。
Apache Arrowが解決したい問題、設計方針、速さの秘密、現在できること、今後できるようになることなど、Apache Arrowを知らない人でもApache Arrowのことがわかるようになる説明をします。
Apache Arrow Flight is a general-purpose client-server framework to simplify high performance transport of large datasets over network interfaces.
みなさんはApache Arrowを知っていますか? 普段データを処理している人でも今はまだ知らない人の方が多いかもしれません。しかし、数年後には「データ処理をしている人ならほとんどの人が知っている」となるプロダクトです。(そうなるはずです。) Apache Arrowはメモリー上でデータ処理するときに必要なもの一式を提供します。たとえば、効率的なデータ交換のためのデータフォーマット、CPU/GPUの機能を活用した高速なデータ操作機能などです。 一部のデータ処理ツールではすでにApache Arrowを使い始めています。たとえば、Apache SparkはApache Arrowを活用することでPySpark(PythonからApache Sparkを使うためのモジュール)とのやりとりを高速化しています。データ量によっては10倍以上も高速になります。(リンク先の例では20秒→0.7秒と約30倍高速になっています。) この講演ではApache Arrowの概要だけでなく最新情報も紹介します。この講演を聞くことでApache Arrowのことを網羅的に把握できます。 Apache Arrowはデータ処理ツールが共通で必要なもの一式を提供するので、より多くのツールがApache Arrowを活用し、より多くの人がApache Arrowの開発に参加すると、より多くの人が豊かになります。Apache ArrowはOSSなのでだれでも自由に活用したり開発に参加したりできます。Apache Arrowのことを知ってOSSならではの「共有するほど豊かになる」アプローチに参加しましょう!
2019年12月時点のApache Arrowの最新情報を紹介します。
Apache Arrow Dataset is one of Apache Arrow components to read and write semantic datasets stored in different locations and formats.
Apache Arrowの開発に参加したい人のためにApache Arrowの情報を紹介します。
Apache Arrow CUDA is a common in-memory columnar data store on CUDA. It's useful to share and process large data.
Apache Arrowの2018年11月現在の最新情報を紹介します。特に、Ruby関連の部分を紹介します。
To use Ruby for data processing widely, Apache Arrow support is important. We can do the followings with Apache Arrow: * Super fast large data interchange and processing * Reading/writing data in several famous formats such as CSV and Apache Parquet * Reading/writing partitioned large data on cloud storage such as Amazon S3 This talk describes the followings: * What is Apache Arrow * How to use Apache Arrow with Ruby * How to integrate with Ruby 3.0 features such as MemoryView and Ractor
Red Arrow PyCall adds `#to_python` method to most Ruby objects for Apache Arrow such as `Arrow::Array`. Red Arrow PyCall adds `to_ruby` method to most Python objects for Apache Arrow such as `pyarrow.lib.Int8Array`.
No description provided.
No description provided.
No description provided.
No description provided.
No description provided.
No description provided.
No description provided.
No description provided.
No description provided.
No description provided.
No description provided.
No description provided.
No description provided.
No description provided.
No description provided.
No description provided.
No description provided.
No description provided.
No description provided.
No description provided.
No description provided.
No description provided.
No description provided.
No description provided.