企業のデータ管理にお悩みのみなさまへ

データガバナンス

ビッグデータのデータガバナンスを実現する
統合プラットフォーム

データガバナンス

ビッグデータのデータガバナンスを実現する統合プラットフォーム

NEW!<毎月開催>Talend Studioでデータ処理の基本を学ぶ 有償トレーニング募集中

NEW!<毎月開催>Talend Studioでデータ処理の基本を学ぶ 有償トレーニング募集中

Talend チュートリアル動画

Talendの機能や操作をわかりやすく解説する動画を用意しています。
ジョブの作成手順を説明していますので、Talend製品の開発生産性の高さをぜひご確認ください。

1-Map/Reduceジョブによる文字カウント

HDFSからデータを取り出し、データ内の単語と出現回数を集計し、結果をMySQLデータベースにロードするMap/Reduceジョブを開発します。

2-Ifリンクを利用したファイル判定と生成

ファイルの存在を確認し、ファイルが存在している場合はエラーメッセージを表示しジョブを終了します。ファイルが存在しない場合はメッセージをポップアップ表示し、ファイルに自動生成したデータをロードします。

3-データの比較とログ出力

ファイルデータの内容を比較し、差異がある場合はログに出力します。差異がない場合は、そのまま処理を終了します。
データ変換の前処理として、内容をチェックするなど、ジョブの開発でよく利用される機能です。

4-ユニークデータの抽出と分割ファイル出力

ユニークなデータを抽出し、繰り返し処理でデータごとに分割して複数のExcelファイルまたはシートに出力します。

ページのトップへ

5-データの集計

tAggregateRowにより、ある商品の生産数を記録したエクセルデータから、平均、最大、最小の生産数を集計します。

6-データの正規化

tNormalizeにより空白や空、重複データが混在するデータから不要な部分を取り除き、正規化された一カラムのデータとして出力します。

7-分類表の空白セルのデータ埋め

tMapでのデータ値による条件分岐を利用し、大分類、中分類という形式だが、分類項目が最初のセルにしか入力されていないエクセルの表を、すべてデータが補完された状態で出力します。

8-メタデータの管理と利用 NEW

ジョブを開発する際にあらかじめリポジトリにデータソースへの接続情報やスキーマ情報をメタデータとして登録する方法とその利用方法です。メタデータを利用することでジョブの開発生産性が向上します。

contact

お問い合わせ・
お見積もりはこちらから