ログイン

左上の入力フォームに、システム管理者から付与されたユーザー名とパスワードを入力して、ログインが可能です。ログイン後に、「データセット作成」ボタン、ユーザー情報、システムの状況が表示されます。

データセット作成

ユーザーによっては、「データセット作成」権限が与えられていない場合があります。

「データセット作成」ボタンを押すと、「ファイルをアップロード」「データベースから抽出」「複数のデータセットを統合」のメニューがプルダウンされます。ユーザーによっては、「データベースから抽出」権限が与えられていない場合があります。

ファイルのアップロード

アップロードするファイルには、以下のサービスがレコードの出力として提供しているタブ区切り形式が利用できます。ユーザー自身で利用権をご確認の上、ご用意ください。

  • Thomson Reuters社の論文検索サービス「Web of Science (R)」
  • Thomson Reuters社の特許検索サービス「Thomson Innovation (R)」

タブ区切り形式で用意するファイルには、文字コードをUTF-8またはUTF-16LE、拡張子はtsvまたはtxtが利用できます。複数あるファイルをフォルダに格納し、このフォルダをZIP形式で圧縮して、本システムにアップロードするデータセットを作成します。

説明に入力する文字列がデータセットの名前となります。

データベースから抽出゙

説明に入力する文字列がデータセットの名前となります。「抽出」ボタンを押すと、クエリに入力した文字列を使ってデータベースを検索し、データセットが作成されます。

複数のデータセットを統合゙

すでに作成した二つ以上のデータセットををひとつにまとめて、新たなデータセットを作成することができます。

データセットの管理と分析

データセット一覧のページからデータセットの名前をクリックすると、分析一覧のページとなります。 分析一覧のページでは、データセットに対し以下の作業を行うことができます。

  • 共有:他のユーザとデータセットを共有できます。
  • 名前の変更:データセットの名前を任意に変更できます。
  • 削除:不要になったデータセットを削除できます。
  • 分析する
  • ダウンロード(もしくは、ダウンロードファイルを作成):データセットをダウンロードできます。

「分析する」を押すと、分析を予約することができます。設定項目:関係(結合関係)、重み函数
また、分析の名前をクリックすると、分析中の進捗、または、分析結果を確認することができます。

関係(結合関係)

結合関係に関しては直接引用と共結合の両方を考慮するなど組み合わせることが可能です。

直接引用
論文 C から論文 A に引用があった場合、論文 A と C 間に結合関係を作成する。 論文の引用主体と引用対象の論文間の類似性を前提として、学術俯瞰マップを描く手法。
共引用
論文Cが論文Aと論文Bを引用していた場合、論文AとB間に結合関係を作成する。 引用主体を共有する(同じ論文内で引用されている)論文同士は類似しているという前提のもと、学術俯瞰マップを作成している。
書誌結合
論文 D と論文 E が同じ論文 C を引用していた場合、論文 D と E 間に結合関係を作成する。 引用対象を共有する(ある論文を両方の論文が引用していたら)論文同士は類似しているという前提のもと、学術俯瞰マップを作成している。

重み函数

デフォルト (重みなし / 共起頻度)
直接引用では重みはすべて同じ(重みなしの状態)に設定されます。 共引用または書誌結合ではそれぞれ共引用、書誌結合の共起頻度を考慮した重みです。 共起頻度が多いほど重みが大きくなるように設定されます。
発行年の差
論文間の発行年の差が少ないほど、重みが大きくなるように設定されます。
引用情報の類似度
参考文献の類似度が高いほど重みが大きくなるよう設定されます。 類似度は参考文献の重複によるコサイン類似度に基づいています。
キーワードの類似度
論文キーワードの類似度が高いほど重みが大きくなるように設定されています。 類似度は論文キーワードの重複によるコサイン類似度に基づいています。

分析結果の表示

分析一覧のページから分析の名前をクリックすると、分析結果の確認ができます。表示項目

「ダウンロード」ボタンを押すと分析結果のデータをダウンロードできます。ダウンロードファイルの詳細

「削除」ボタンを押すと分析結果を削除できます。

それぞれの論文には、その論文が含まれるクラスタ番号とその論文の次数(つながりの数)が表示されます。

サブクラスタを選択することで、選択したサブクラスタの情報を表示します。 サブクラスタの論文数は、サブクラスタに含まれる論文数となるのでノード数を同じになります。

分析結果に含まれる論文をキーワードで検索することができます。 各論文の著者キーワード、タイトル、アブストラクトを対象に検索でき、検索には AND、OR、NOT とフレーズ検索が使用できます。

選択したサブクラスタの論文集合またはキーワードの検索結果の論文集合を元にして「新しくデータセットを作成」することができます。新しいデータセットを作成する際に、特定の論文を除去して「新しくデータセットを作成」することも可能です。 特定の論文を除去する場合、除外する論文ID(論文リストにて表示されている番号)を半角数字でカンマ区切りにより入力し、「作成」ボタンを押すと、特定の論文を除去したデータセットが作成されます。

表示項目

分析結果の概要には以下の情報が表示されます。

平均出版年
クラスタに含まれる論文の平均出版年
論文数
アップロードしたデータに含まれる論文数
ノード数
クラスタに含まれる論文数
エッジ数
クラスタに含まれる論文間のつながりの数
クラスタ数
すべてのクラスタの数

また、キーワード、国籍、組織、ジャーナル、著者、発行年をクリックすると、ランキング上位の内容と件数が表示されます。

キーワード
クラスタを特徴づけるキーワード、括弧内の数値が大きいほど特徴的なキーワードを示します。
国籍
クラスタに含まれる論文の著者の所属組織の国別統計、括弧内が国の数
組織
クラスタに含まれる論文の著者の所属組織の統計、括弧内が組織の数
ジャーナル
クラスタに含まれる論文のジャーナルの統計、括弧内がジャーナルの数
著者
クラスタに含まれる論文の著者の統計、括弧内が著者の執筆した論文数
発行年
クラスタに含まれる論文の発行年の統計、括弧内が該当する発行年の論文数

分析結果のダウンロード

分析結果は、以下の主なファイルを含む zip ファイルとしてダウンロード可能です。

mission.info.[ all, 0, 1, ... ].tsv

クラスタの情報。番号はクラスタの番号。

BASE_YEAR
基準年
AGE
論文発行からの経過年の平均
NODE_COUNT
クラスタに含まれる論文数
EDGE_COUNT
クラスタに含まれる論文間のつながりの数
FACET_COUNT
データに含まれる論文数

mission.facet.[ all, 0, 1, ... ].tsv

クラスタに含まれる書誌情報。番号はクラスタの番号。

NU
論文 ID
AU
著者名
TI
タイトル
J9
ジャーナル名
VL
Vol
BP
開始ページ
PY
発行年
CR
引用論文
NR
引用論文数
TC
WoS 内被引用数
EN
クラスタ内被引用数
DN
データセット内被引用数
AB
アブストラクト
DE
著者キーワード
ID
キーワードプラス
AF
著者名(フルネーム)
C1
所属
SC
ジャーナル分野

mission.keyword.[ all, 0, 1, ... ].tsv

クラスタに含まれるキーワード情報。番号はクラスタの番号。

TC
単語のクラスタにおける出現回数
TF
TC / (クラスタに含まれる総単語数)
CC
単語を含むクラスタ数
ICF
log{ (総クラスタ数) / CC }
TFICF
TF*ICF
DC
単語を含むドキュメント数
IDF
log{ (総文章数) / DC }
TFIDF
TF*IDF

mission.pairs.tsv

引用関係。一列目が引用元の論文 ID、二列目が引用先の論文 ID。

mission.pairs-fc_a.info

クラスタリング結果の出力ファイル。

MAXQ
モジュラリティ

mission.pairs-fc_a.groups

GROUP [...] [...]
クラスタの代表ノード番号、ノード数
...
そのクラスタに含まれる論文ID

俯瞰図の作成と表示

分析結果のページの「俯瞰図」タブから、学術俯瞰マップの作成および表示を行うことができます。「俯瞰図を作成」ボタンを押すと、学術俯瞰マップの作成が予約されます。

グラフツールの利用

グラフツールでは、クラスターに含まれる論文単位で学術俯瞰マップをインターラクティブに操作することができます。

ヒートマップの利用

ヒートマップでは、分析結果からクラスター間の類似度が表示されます。分析結果を複数、設定することもできます。