第2回 Sharegateに関する「よくある質問」まとめ

こんにちは。
先週Sharegateの大幅アップデートがあり、UIががらりと変わりましたね。
アップデート後のUIのご紹介も兼ねて、前々回に続いて、
「第2回 Sharegateに関する『よくある質問』まとめ」を投稿したいと思います。
 
 

① レポーティングについて

Sharegateのレポーティング機能によって、SharePointに関する様々な情報を取得することができます。 ただ、何でも取得できるというわけではありません。
そのため、「○○は取得できますか?」といった質問が複数寄せられています。
ここでは、そういった質問をまとめて、取得可能な情報とそうでない情報について共有していきたいと思います。
 

取得可能な情報

レポーティング機能によって取得可能な情報は、こちらから確認することができます。
例として、Audit Reportの内容を挙げてみたいと思います。Audit Reportでは、サイトコレクション/ユーザー/期間を指定し、指定条件下で発生したイベントを出力します。

 
また、生成されたレポートはExcelへの出力も可能です。
 
(上画像の右上にある[Export]ボタンをクリック)

 

取得できない情報

  • 特定のサイトコレクション毎のドキュメントのダウンロード数
  • サイトアクセス、ページ閲覧数
  • アップロードの履歴
  • SharePoint 2007の情報
  • アラート通知設定に関する情報
  • ファイルの最終閲覧日

現時点で取得ができないとされている情報については、Sharegateの保守を通して弊社が把握している限りの情報です。
そのため、上記がすべてではありません。
 
 

② 移行時のサーバーへの負荷について

「移行時のサーバーへの負荷を確認・調節する方法はありますか?」
「移行時のサーバーへの負荷を調節する時の選択肢について説明してほしいです。」といった質問も複数寄せられています。
そこで、今回は「負荷の調節方法」を中心に、情報を共有していきます。
 

負荷の調節方法

1. [setting] をクリックします。

 
 
2. [General] タブをクリックします。
(初期表示で既に[General]タブが選択されてます。)
4種類のパフォーマンスレベルから選択します。

 
 
3. 各パフォーマンスレベルの詳細は、次の通りです。(高レベル順)

※パフォーマンスレベルが高いほど、サーバーへの負荷も大きくなるため、
 お使いの環境に合わせて調節してください。
 
また、移行スピードの調節も可能です。
先ほどの[setting]画面から、[Migration]タブをクリックします。
InsaneモードとNormalモードを選択することができます。

 
Insaneモードの方がNormalモードよりも速いですが、オンプレミス版を使って移行を行う場合、移行先と移行元の両方にserver extensionが必要になります。
※SharegateLite版には、Insaneモードがございません。
 
 

③ 差分コピーの方法について

「差分コピーの方法について教えてください。」
「移行先と移行元で、同じアイテムであると判断している条件は何?」といった質問も複数寄せられています。
そこで、「差分コピーの設定」と、「差分アイテムであるかどうかをSharegateが判断する方法」についてご紹介します。
 

差分コピーの設定

1. 移行元と移行先のオブジェクトを決定します。この画面まで到達したら、右下の
[Advanced Copy]をクリックします。

 
2. [Operation Mode] の[Copy if newer (incremental copy)]をクリックします。
この設定により、更新日付が移行元より過去の場合のみ、アイテムを置き換えます。

 
※移行先のアイテムが削除されていたり階層が異なっていたりした場合は、
新しいアイテムとして作成されます。
※Office 365でInsaneモードを使用する場合、Azure Import APIの制限のため、
移行先のすべてのバージョンが移行元のバージョンに置き換えられます。
他にも[Operation Mode] には、「重複したアイテムの名前を変換しコピーする」
等のモードが存在します。詳しくはこちらを参照ください。
 
差分アイテムであるかどうかをSharegateが判断する方法は、リストのアイテムかドキュメントかで異なります。ドキュメントの場合はファイル名で判断しています。
一方リストのアイテムの場合は、Sharegateがリストによって最適なキー(フィールド)を決定します。
 
 
いかがでしたでしょうか。 今回はレポーティング機能とマイグレーション機能に絞って情報共有いたしました。次回はまた別の機能についての情報共有もしていきたいと思います。 次回以降も読んでいただければ幸いです。
 
※今回記載した回答は、現時点での仕様をもとに作成しましたので、Sharegateのアップデートに伴い変更される可能性があります。

第1回 Azure Machine Learning のチュートリアルを試してみた

はじめまして、テンダの鈴木です。
今年で入社2年目で、現在Azure について学んでおります。
その中でもAzure Machine Learning について焦点をあてて、調査をしています。
そこで、Azure Machine Learning について学んだ内容や、研究開発で作成したサンプルプログラムについて、投稿していきたいと思います。

今回は初回なので、「Azure Machine Learning とは何か」というテーマで書いていきます。

■Azure Machine Learning とは?

Azure Machine Learning (以下AzureMLと記述)は、Microsoft が提供するクラウドサービスセット「Azure」の中のひとつで、名前の通り機械学習を行なうためのサービスです。

AzureML はコードを書く必要がなく、GUIでの操作が可能です。
そのため、ユーザーは簡単に予測分析ソリューションを構築、デプロイ、共有できます。

■機械学習とは?

AzureML が機械学習を行なう為のサービスだと記述しました。
しかし、そもそも機械学習とは何か…簡単に説明いたします。

大量の既存データから学習を行い、そこに存在するパターンを探し出して、次の行動、結果、傾向を予測する処理を機械学習といいます。
機械学習を活用しているサービスには、以下のようなものがあります。

  • 通販サイトにある「あなたのおすすめ商品」
  • 小売店の販売予測や自動発注
  • 顔検出

また、機械学習には「教師有り学習」と「教師なし学習」などの学習方法が存在します。
※教師有り学習:既にデータに付随されているラベルによって、教えられた構造を学習する方法です。
※教師なし学習:データのみから、規則性を見つけ出し学習する方法です。

機械学習は、人工知能(AI)における研究課題になっています。

■Azure Machine Learning を使ってみる

AzureML は、初めて使用するユーザーの為に、チュートリアルが用意されています。
AzureML を学ぶとっかかりとして、私はこのチュートリアルを行なうことにしました。

今回行ったチュートリアルは、「Machine Learning のチュートリアル」の記事です。「モデルの作成、モデルのトレーニング、モデルのスコア付けとテスト」の流れで、新自動車の価格を予測するモデルを作成します。
AzureML はどのように操作できるのか、簡単にモデルを作成できるのか…を確認します。


①モデルの作成

チュートリアルでは、AzureML で用意されている複数のサンプルデータから、自動車価格データを使用して、実験(EXPERIMENT)を作成します。
サンプルデータは、[Saved Datasets]の中の[Samples]に用意されています。

 

このサンプルデータを、分析が行なえる形に整理し、学習アルゴリズムで使用する列を定義します。
AzureML に用意されているモジュール[Select Columns in Dataset][Clean Missing Data]を使用してデータを整理した結果、値が不足していた列・行が削除され、定義した列のみ表示されています。

 

ここまでの作業で気になったのは、学習アルゴリズムで使用する列を定義するところです。
ここで選択する列によって、優れた結果が得られるかが決まるようです。


②モデルトレーニング

①で作成したデータを使用して、モデルのトレーニングとテストを行い、価格を予想する精度を確認します。
今回、価格を予測したいので、数値を予測する目的で使用される、回帰アルゴリズムを使用します。

[Split Data]モジュールを使用して、データをモデルのトレーニング用と、テスト用に分割します。
モデルのトレーニングとテストが何を行なうかは、以下の通りです。
トレーニング:自動車の特徴と価格の相関関係を検出します。
テスト:モデルが既知の価格を余禄する精度を確認します。
チュートリアルでは、トレーニングに75%のデータを使用し、③で行なうテストには残り25%を使用します。

学習アルゴリズムに回帰アルゴリズムを使用するを記述しましたが、今回は最も単純な線形回帰を使用します。
線形回帰モデルを使用するには、[Linear Regression]モジュールを用います。

ここまでの、マップは以下のようになっています。
とてもシンプルな形で、チュートリアルに従って進めていけば、1時間もしないでここまで出来ました。

 

③モデルのスコア付けとテスト
②で残っていた25%のデータに、[Score Model]モジュールを使用して、スコア付けを行い、価格を予測します。
今回の分析で、予測された新自動車の価格は、以下の通りです。

 

分析結果は、[Score Model]モジュールを右クリックし、[Scored dataset]>[visualize]を選択すると見ることが可能です。
また、選択してでてきたダイアログの右側にある、[visualizations]から以下のようなヒストグラムを見ることができます。

 

最後に、[Evaluate Model]モジュールを用いて、この予測結果を評価します。
今回の結果は、以下の通りでした。

 

上から、平均絶対誤差/二乗平均平方根/相対絶対誤差/相対二乗誤差/決定係数 になります。
決定係数の値が1に近づくほど、予測の精度が高いと判断されます。
今回のチュートリアルでは、決定係数が約0.9なので、比較的高い精度だと考えます。

■Azure Machine Learning を使ってみて

今回はチュートリアルのため、データが用意されており、学習方法が提示された状態で行なった為、簡単に結果を表示することができたと思います。
モデルに必要な列の選定や、使用する機械学習アルゴリズムの選択さえ出来れば、AzureML が用意してくれているモジュールを使用できるので、直感的に分析を行なえます。
しかし、予測結果の評価など、機械学習における前提知識はやはり必要になるので、まだまだ勉強が必要です。

また、Microsoft が提供している実験(EXPERIMENT)を見てみるのも面白いと思います。

次回は、AzureML の研究開発で作成するサンプルプログラムについて、投稿する予定です。