ヘルプ - 俯瞰システム

データセット作成

ユーザーによっては、「データセット作成」権限が与えられていない場合があります。

「データセット作成」ボタンを押すと、「ファイルをアップロード」「データベースから抽出」「複数のデータセットを統合」のメニューがプルダウンされます。ユーザーによっては、「データベースから抽出」権限が与えられていない場合があります。

ファイルのアップロード

アップロードするファイルには、以下のサービスがレコードの出力として提供しているタブ区切り形式が利用できます。ユーザー自身で利用権をご確認の上、ご用意ください。

Thomson Reuters社の論文検索サービス「Web of Science (R)」
Thomson Reuters社の特許検索サービス「Thomson Innovation (R)」

タブ区切り形式で用意するファイルには、文字コードをUTF-8またはUTF-16LE、拡張子はtsvまたはtxtが利用できます。複数あるファイルをフォルダに格納し、このフォルダをZIP形式で圧縮して、本システムにアップロードするデータセットを作成します。

説明に入力する文字列がデータセットの名前となります。

データベースから抽出゙

説明に入力する文字列がデータセットの名前となります。「抽出」ボタンを押すと、クエリに入力した文字列を使ってデータベースを検索し、データセットが作成されます。

複数のデータセットを統合゙

すでに作成した二つ以上のデータセットををひとつにまとめて、新たなデータセットを作成することができます。

データセットの管理と分析

データセット一覧のページからデータセットの名前をクリックすると、分析一覧のページとなります。分析一覧のページでは、データセットに対し以下の作業を行うことができます。

共有：他のユーザとデータセットを共有できます。
名前の変更：データセットの名前を任意に変更できます。
削除：不要になったデータセットを削除できます。
分析する
ダウンロード（もしくは、ダウンロードファイルを作成）：データセットをダウンロードできます。

「分析する」を押すと、分析を予約することができます。設定項目：関係（結合関係）、重み函数
また、分析の名前をクリックすると、分析中の進捗、または、分析結果を確認することができます。

関係（結合関係）

結合関係に関しては直接引用と共結合の両方を考慮するなど組み合わせることが可能です。

直接引用: 論文 C から論文 A に引用があった場合、論文 A と C 間に結合関係を作成する。論文の引用主体と引用対象の論文間の類似性を前提として、学術俯瞰マップを描く手法。
共引用: 論文Cが論文Aと論文Bを引用していた場合、論文AとB間に結合関係を作成する。引用主体を共有する(同じ論文内で引用されている)論文同士は類似しているという前提のもと、学術俯瞰マップを作成している。
書誌結合: 論文 D と論文 E が同じ論文 C を引用していた場合、論文 D と E 間に結合関係を作成する。引用対象を共有する(ある論文を両方の論文が引用していたら)論文同士は類似しているという前提のもと、学術俯瞰マップを作成している。

重み函数

デフォルト (重みなし / 共起頻度): 直接引用では重みはすべて同じ(重みなしの状態)に設定されます。共引用または書誌結合ではそれぞれ共引用、書誌結合の共起頻度を考慮した重みです。共起頻度が多いほど重みが大きくなるように設定されます。
発行年の差: 論文間の発行年の差が少ないほど、重みが大きくなるように設定されます。
引用情報の類似度: 参考文献の類似度が高いほど重みが大きくなるよう設定されます。類似度は参考文献の重複によるコサイン類似度に基づいています。
キーワードの類似度: 論文キーワードの類似度が高いほど重みが大きくなるように設定されています。類似度は論文キーワードの重複によるコサイン類似度に基づいています。

分析結果の表示

分析一覧のページから分析の名前をクリックすると、分析結果の確認ができます。表示項目

「ダウンロード」ボタンを押すと分析結果のデータをダウンロードできます。ダウンロードファイルの詳細

「削除」ボタンを押すと分析結果を削除できます。

それぞれの論文には、その論文が含まれるクラスタ番号とその論文の次数（つながりの数）が表示されます。

サブクラスタを選択することで、選択したサブクラスタの情報を表示します。サブクラスタの論文数は、サブクラスタに含まれる論文数となるのでノード数を同じになります。

分析結果に含まれる論文をキーワードで検索することができます。各論文の著者キーワード、タイトル、アブストラクトを対象に検索でき、検索には AND、OR、NOT とフレーズ検索が使用できます。

選択したサブクラスタの論文集合またはキーワードの検索結果の論文集合を元にして「新しくデータセットを作成」することができます。新しいデータセットを作成する際に、特定の論文を除去して「新しくデータセットを作成」することも可能です。特定の論文を除去する場合、除外する論文ID（論文リストにて表示されている番号）を半角数字でカンマ区切りにより入力し、「作成」ボタンを押すと、特定の論文を除去したデータセットが作成されます。

表示項目

分析結果の概要には以下の情報が表示されます。

平均出版年: クラスタに含まれる論文の平均出版年
論文数: アップロードしたデータに含まれる論文数
ノード数: クラスタに含まれる論文数
エッジ数: クラスタに含まれる論文間のつながりの数
クラスタ数: すべてのクラスタの数

また、キーワード、国籍、組織、ジャーナル、著者、発行年をクリックすると、ランキング上位の内容と件数が表示されます。

キーワード: クラスタを特徴づけるキーワード、括弧内の数値が大きいほど特徴的なキーワードを示します。
国籍: クラスタに含まれる論文の著者の所属組織の国別統計、括弧内が国の数
組織: クラスタに含まれる論文の著者の所属組織の統計、括弧内が組織の数
ジャーナル: クラスタに含まれる論文のジャーナルの統計、括弧内がジャーナルの数
著者: クラスタに含まれる論文の著者の統計、括弧内が著者の執筆した論文数
発行年: クラスタに含まれる論文の発行年の統計、括弧内が該当する発行年の論文数

分析結果のダウンロード

分析結果は、以下の主なファイルを含む zip ファイルとしてダウンロード可能です。

mission.info.[ all, 0, 1, ... ].tsv

クラスタの情報。番号はクラスタの番号。

BASE_YEAR: 基準年
AGE: 論文発行からの経過年の平均
NODE_COUNT: クラスタに含まれる論文数
EDGE_COUNT: クラスタに含まれる論文間のつながりの数
FACET_COUNT: データに含まれる論文数

mission.facet.[ all, 0, 1, ... ].tsv

クラスタに含まれる書誌情報。番号はクラスタの番号。

NU: 論文 ID
AU: 著者名
TI: タイトル
J9: ジャーナル名
VL: Vol
BP: 開始ページ
PY: 発行年
CR: 引用論文
NR: 引用論文数
TC: WoS 内被引用数
EN: クラスタ内被引用数
DN: データセット内被引用数
AB: アブストラクト
DE: 著者キーワード
ID: キーワードプラス
AF: 著者名(フルネーム)
C1: 所属
SC: ジャーナル分野

mission.keyword.[ all, 0, 1, ... ].tsv

クラスタに含まれるキーワード情報。番号はクラスタの番号。

TC: 単語のクラスタにおける出現回数
TF: TC / (クラスタに含まれる総単語数)
CC: 単語を含むクラスタ数
ICF: log{ (総クラスタ数) / CC }
TFICF: TF*ICF
DC: 単語を含むドキュメント数
IDF: log{ (総文章数) / DC }
TFIDF: TF*IDF

mission.pairs.tsv

引用関係。一列目が引用元の論文 ID、二列目が引用先の論文 ID。

mission.pairs-fc_a.info

クラスタリング結果の出力ファイル。

MAXQ: モジュラリティ

mission.pairs-fc_a.groups

GROUP [...] [...]: クラスタの代表ノード番号、ノード数
...: そのクラスタに含まれる論文ID

俯瞰図の作成と表示

分析結果のページの「俯瞰図」タブから、学術俯瞰マップの作成および表示を行うことができます。「俯瞰図を作成」ボタンを押すと、学術俯瞰マップの作成が予約されます。

グラフツールの利用

グラフツールでは、クラスターに含まれる論文単位で学術俯瞰マップをインターラクティブに操作することができます。

ヒートマップの利用

ヒートマップでは、分析結果からクラスター間の類似度が表示されます。分析結果を複数、設定することもできます。

ログイン