OneLake に置いたデータを Notebook から扱う “最初のステップ”

はじめに

前回の記事では、OneLake にファイルを置くための方法を整理しました。
では、置いたファイルを Fabric の中でどのように扱うのか。ここが次の疑問になる方も多いと思います。

Fabric には、Lakehouse、Warehouse、Eventhouse など複数のデータワークロードがあります。
それぞれデータの扱い方は異なりますが、今回はその中でも OneLake と Lakehouse を組み合わせて Notebook を使うケース にフォーカスします。

Notebook という名称自体、Fabric に触れ始めた段階では馴染みがない方もいると思います。
そこで今回は、

  • Notebook がどんなものなのか
  • OneLake に置いたファイルが Notebook からどう”見える”のか
  • Notebook を触り始めるための入口となる操作

を整理します。

image.png

Notebook を使った本格的な加工や Delta 形式での保存は、また別の記事で扱います。


1. Fabric の Notebook はどんなものか

image.png

Fabric の Notebook は、Python / PySpark を使ってデータを読み込み、整形・加工できる作業環境です。

  • データ前処理
  • 集計
  • Delta テーブル化
  • 大量データの一括処理

といった、Power BI だけでは扱いにくい領域を補います。

この記事では Notebook の詳細ではなく、
「OneLake に置いたファイルが Notebook からどう見えるか」
という最初の地点を扱います。


2. Notebook が扱うのは Lakehouse の「Files」と「Tables」

Lakehouse には、Notebook から扱える領域として Files と Tables の 2 つがあります。

前回の記事でも触れましたが、
Files は生データを保存する領域、Tables は Delta テーブルとして管理される領域です。

今回はこのうち Files 側を中心に、
Notebook からどのように見え、どう読み込めるのかを確認していきます。

Files と Tables それぞれの具体的な見え方は、
セクション 5「Notebook から見える Lakehouse の構造」で詳しく触れます。


3. Notebook で扱うために OneLake にファイルを置く

Notebook から扱うためには、ファイルを Lakehouse の Files に配置します。

解説の続きは、Qiitaの記事をご覧ください。