ネット書誌事項を確かめるには

ウェブ版『検索マニュアル』第三部
ネット書誌事項を確かめるには
まずウェブページについて

（最終更新時：2014年5月7日／建築開始：2008年06月02日）

目次
ネット書誌事項とは
 ウェブページを調べよう
ウェブページのＵＲＬを調べよう
ＵＲＬからわかること（練習問題その３／その４）
あなたの「ドメイン名」は相手に伝わる
※別ページ「アクセスだけで伝わるあなたの情報実例編」

ウェブページの著者名と題名を探そう（練習問題その５）
ページの更新時と閲覧時を調べよう

○ネット書誌事項とは

　先のページ「引用の作法とは」の末尾の繰り返しですが、次の７項目です。

（なお、これらをひとまとめにしたコトバとして、ここでは本の「書誌事項」に準じて、「ネット書誌事項」という用語を用いますが、一般的にはなんと言うのだろう？　良い言い方を御存知の方は教えてください。）
(1)ウェブページの著者名
(2)ウェブページの題名
(3)ウェブページのＵＲＬ（Uniform Resource Locator）
(4)そのウェブページが属するウェブサイト（親サイト）の名称　※下記ではこのサイトを当該ウェブページの「親サイト」と呼びます。
(5)親サイトの運営者名　※サイト名称からわかる場合、またはウェブページの著者名と同じであれば省略可能。
(6)ウェブページの作成時（更新時）
(7)あなたがそのウェブページを閲覧した時
　なお、ここで説明する“ネット書誌事項”は原則として松本の講義や演習に適用するものです（実際にレポートを書く際には、それぞれの講義ごとに指示をしますので、それに従ってください。手書きレポートの場合はＵＲＬは省略ＯＫとしています）。
　先生によって考え方は様々ですし、特に学会誌や紀要等の雑誌に書く論文の場合は、その雑誌の「投稿規定」に従いましょう。とは言え、以上の“ネット書誌事項７項目”が分かっていれば、大体は対応できるはずです。ただし、別ページの「トラブル対処法」で説明した「Not Found」問題に象徴されるように、ネット自体が本来的に流動的・不安定なものであるため、そもそもウェブページが出典として信用が置けるものかどうかという議論はあります。（このあたりの欠点（仕様？）に対応するため、ウェブアーカイブのような保管施設ができてはきていますが、お金に糸目を付けなければ必ず“古本”が手に入る書籍の世界とはレベルが違う。）

○ウェブページを調べよう

　さて、まずはウェブページについて、
(1)著者名
(2)題名
(3)ＵＲＬ
--- の三つを確かめましょう。
　ウェブページの(2)題名や(1)著者名はページの冒頭に表示されているのが普通ですが、時にはどこを探しても書いていない場合があります。しかし(3)ＵＲＬは閲覧ソフトの「住所」または「アドレス」の部分に表示されていますし、そもそもの検索エンジンで検索結果が表示された時にも必ずＵＲＬは表示されます。ということでまずは(3)のＵＲＬから行きます。

○ウェブページのＵＲＬを調べよう

＜そのページに「フレーム」はありますか？＞
　先に「ＵＲＬは必ず表示されます」と書いたものの、表示されない場合があります。それが「フレーム」を使ったウェブページの場合です。
　問題のウェブページをよく見てください。一つの窓が複数のフレーム（枠）に分割されているような感じがしますか？　わかりにくければ、窓のどこかをスクロールしてみてください。その時にページ全体が動くのではなく、どこかは動かないままならば、そのページはフレームを使っています。また、リンク先をクリックして別のページにジャンプした時に、窓の一部だけが元のページのままという場合も同じくです。
　こうした「フレーム」機能を使ったページでは、一つの窓の中でそれぞれ別個のＵＲＬを持ったページを同時に見せるようにしていますから、目的のページのＵＲＬは閲覧ソフトのＵＲＬ表示欄には表示されない場合の方が多いです。
　この場合は、当該ページだけをフレームから取り出す機能を使い、新たな窓を開いてからＵＲＬを確かめます。別ページ「中級テクニック」での説明を参考にしてください。
○ＵＲＬからわかること
　こうしてわかったＵＲＬからだけでもウェブページについてかなりの情報が手に入ります。そのウェブページが属しているサーバーの持ち主がわかったり、更にはウェブサイトの運営者名も推測がつくからです。これは検索エンジンでページのタイトルとＵＲＬしかわからない場合でも応用できます。
　そこで、ＵＲＬの仕組みについて最小限の説明をしておきます。
（A）コンピュータの居所：ホスト名とドメイン名

　例えば…と、皆さんお馴染みの山大ウェブサイト玄関ページのＵＲＬを例に挙げます↓。

　これが何を表しているのかというと、まずコロン「:」までの部分（http）はコンピュータ同士がデータを受け渡しする際の決まり（プロトコル）を指定するもので、この「http」の場合は「HyperText Transfer Protocol」を意味します。「HyperText」は別ページで説明したHTMLファイルの「ＨＴ」と同じで、「http」とはまさに“HTMLファイルをコンピュータ同士が受け渡しする際の決まり事”というわけです。
　そして次のスラッシュ二つ「//」の後ろから次のスラッシュまでの部分（www.yamagata-u.ac.jp）が、データが入っているコンピュータのインターネット内での居場所を表します。まず最初の「www」は，コンピュータ（サーバー）自体の名称で、これを「ホスト（host）名」と言います。インターネットに接続しているコンピュータは --- あなたの今使っているパソコンも --- すべて「ホストコンピュータ」と言います。次にこのホストコンピュータが属する組織の名称（「ドメイン（domain）名」）です。
　さらに「ドメイン名」の次、スラッシュで区切ってから、そのコンピュータの中のどこに、求めるファイルがあるかどうかを示した上で、最後に，求めるファイルの名前「index-j.html」が示されます。
　まとめると、以下のようになります。
(1) プロトコルは「HyperText Transfer Protocol」
(2)-1 ホスト名は「www」（「www」というホストコンピュータ）
(2)-2 ドメイン名は「yamagata-u.ac.jp」　※以上二つをあわせて「完全なドメイン名」
(3) そこから自分のパソコンがもらってきて表示するファイル名「index-j.html」

※ここで練習問題その３：山形大学のホストコンピュータ「www.yamagata-u.ac.jp」からあなたのコンピュータが「index-j.html」とは２字違いのファイル「index.html」をもらってくると、どんなページが表示されますか？　別ページ「トラブル対処法」で説明の「ＵＲＬ短縮法」を応用し、上記のＵＲＬ
http://www.yamagata-u.ac.jp/index-j.html
--- の一部を書き換えて、実際にアクセスしてみましょう。

（B）ファイルのありか：パス名
　そしてコンピュータの中身は「ディレクトリ」によって更に細かく区分けされます。そのコンピュータの中のどこに求めるファイルがあるのかを表すのが「パス名」です。
　ディレクトリのあるＵＲＬの例として、松本サイト玄関を挙げておきます↓。

※ここでも練習問題その４：上記の山大サイト玄関のＵＲＬとこの松本サイト玄関のＵＲＬとを見比べ、ホスト名とドメイン名の類似点、相違点をチェックしてください。
　　このディレクトリを利用したトラブル解決法として別ページ「トラブル対処法」にて「ＵＲＬ短縮法」を紹介したとおり、ディレクトリはスラッシュ「/」を入れて右に右にと連ねていくことによって、更に細かいディレクトリに分けることができます。いわばビルの中の１階２階の区別のようなものです。そしてファイル名は同じでも、属するドメインやディレクトリさえ異なればコンピュータはそれぞれを別のものとして取り扱います。例えば「index.htm」は世界中のホストコンピュータの中に存在していますが、それぞれが別個のファイルなのです。

（C）ドメイン名の読み方
　　ドメイン名を更に分割すると、右側からピリオド（ドットとも言う）で区切りつつ、「トップレベルドメイン」、「第２レベルドメイン」、「第３レベルドメイン」と呼びます（↓。「第４」「第５」もある）。そしてその組織の特徴を表すのが「トップ」と「第２」です。

　まず山大ウェブサイト玄関ＵＲＬの「トップレベルドメイン」の「ｊｐ」は「国別トップレベルドメイン」と言い、「Japan」つまり日本という国名を表します。同様に諸外国の国名も二文字で表され、韓国は Koreaの「ｋｒ」、オーストラリアは「ａｕ」です。もっとも「http://home.netscape.com」のように「一般トップレベルドメイン」としての「ｃｏｍ」（商業組織）や「ｎｅｔ」（ネットワーク活動組織）を用いるドメインもあります。
　そして「第２レベルドメイン」ですが、これでだいたい組織の性格がわかるようになっています。こういう具合です↓。

「ａｃ」は academy つまり大学など学術団体、教育団体

http://www.trc.co.jp 　 ---- の「ｃｏ」は company 商業組織

http://www.kantei.go.jp　　 ---- の「ｇｏ」は government 政府機関（「gov」の場合はトップレベルドメインで、アメリカ政府機関用）

　　この“推測”は、ウェブページを表示させる前にする方が役立ちます。検索エンジンで検索結果が表示された際に、いちいち見に行かずともページの性格をチェックできるからです。

○あなたの「ドメイン名」は相手に伝わる
　なお皆さん自身もインターネットではドメインを使っていることを自覚していてください。それはインターネットの仕組みが、（実は）放送局が不特定多数にデータを送る“放送”（誰が放送を見て・聞いているのかはわからない）ではなく、特定の相手とデータをやりとりする“電話”に近いからです。もっとも（見かけ上は）同時に何人もの相手と会話ができる点は電話とは大きく違いますが。
　あなたが特定のウェブサイトにアクセスした場合、そのサイトのページのファイルを貯蔵しているホストコンピュータ（サーバー）は、あなたの使っているホストコンピュータ（サーバーに対してこれを「クライアント client」と言う）からの要求に応えて、あなたのコンピュータにページのデータを送ってきます（その際の決まり事が上記「コンピュータの居所」に登場した「http」）。この二つのホストコンピュータは、お互いの相手をどう特定するのか？　ドメイン名と同時に、“コンピュータ同士だけで分かる符丁”つまり「ＩＰアドレス」という無味乾燥な数字の羅列で特定します。
　よって、大学の共用パソコンでアクセスした場合、アクセスの相手は自分のコンピュータ（サーバー）に残ったアクセス記録（log）を見ることで，“○○大学からインターネットエクスプローラを使ってアクセスしてきたな”とわかりますし、自宅のパソコンからプロパイダーを通した場合はプロパイダーが使っているホストコンピュータのドメイン名とＩＰアドレスが相手に伝わります。つまりネット世界でも完全な匿名というのはありえないのです。これを悪用した詐欺が通称“ワンクリック詐欺”（最近では“ツークリック詐欺”）であり、松本が体験した実例を別ページ「アクセスだけで伝わるあなたの情報」に紹介していますので一読してください。
※アクセスログを記録していることを明示しているウェブサイトの例↓（他のウェブサイトも、明示はしていなくても記録はしていると見て良い。）
(社)コンピュータソフトウェア著作権協会
http://www2.accsjp.or.jp/
＞著作権・セキュリティについて
http://www2.accsjp.or.jp/policy/in_policy.html

　また、サーバーとあなたのコンピュータ（クライアント）とのやりとりは一対一でおこなわれるわけではなく、いくつものホストコンピュータが仲立ちをします。つまり途中での“覗き見”が可能です。たとえばメールでも、会社内で上司が部下のメールの内容を読むことも可能なわけです（私用メールの有無や社外秘情報の漏洩チェックなど）。
　よって、ハガキにあなたが内緒事を書かないように、オンラインショッピングでクレジットカードの番号を入力する時には「暗号」機能が必要になるわけですが、そちらは本書では略します。別ページ「電子時代の倫理とマナー」で紹介した参考書を読んでください。

○ウェブページの著者名と題名を探そう

○著者名・題名がわからない場合
　わからないことは無いだろう…と思われるかもしれませんが、例えばゼミ論や卒論を掲載しているウェブサイトがあった場合、その一部（第２章だけとか注釈だけとか）のページだけ見ていては、ふつうは著者名も題名もわかりません（そもそもゼミ論かどうかもわからないわけですが）。その場合は別ページの親サイト探しのテクニックを準用して論文の「表紙」か「目次」のページを探しに行く必要があります。
※ここで練習問題その５です。次のサイトの管理者名は？　字が小さなページなので一苦労だとは思いますが。
ＳＡＲＳ　(重症急性呼吸器症候群)　の情報源
http://www.geocities.co.jp/Technopolis/7663/

○仮名と実名
　さてせっかく判明したページの著者が匿名あるいは仮名（ネット世界では「ハンドルネーム」と言う）である場合、あなたのレポート・論文に引用できるほどの信頼性があるかどうかはちょっと怪しくなります。しかもややこしいことに、“「ハンドル名」イコール無責任”、あるいは“実名イコール信頼性あり”と単純には言えない現実があります。
　2002年初頭の田中外相更迭（こうてつ）事件が顕著な例ですが、実名が出てても堂々と“シラを切る”人がいるのは確かですし、問題の国会議員の逆鱗（げきりん）に触れてこの事件の発端となったＮＧＯ代表の発言がまさに「お上の言うことはあまり信用しない」(*)だったというのは象徴的です。公的機関だからと言って鵜（う）呑（の）みにするのは「甘い甘い甘い」（その４）。
＊『朝日新聞』朝刊 2002.01.18「ひと／大西健丞さん」での大西氏の発言
　つまり別ページのようにして親サイトを確かめ、更にはサイトのその他のページの内容も見て、信頼に足るサイトかどうかまで考えて、ウェブページの中の情報の真偽の程度を慎重に判断する必要があるのです。これはけっこう面倒です。

○ページの更新時と閲覧時を調べよう

　さて順序は前後しますが、ネット書誌事項の(7)「閲覧時」の方は、あなたがそのウェブページを閲覧した時ですから調査の要は無いでしょう（が、忘れないようにメモは必要です）。なお何時何分何秒までは不要で、年月日まででＯＫです。
※書籍や雑誌論文と違って、なぜこのデータがウェブページには必要かは分かりますか？　引用の作法を必要とする第二の理由を思い出してください。読者があなたのレポートを読んで、そのウェブページにアクセスしようとした場合、必ずアクセスできるとは限りません。Not Foundとなったら？　読者はどこに転居したかを探すでしょうが、まず疑われるのはあなたです。“本当にそんなウェブページがあったの？”→“いや、私がアクセスしたときは確かにあったんですよ。信じてください”。そのために閲覧時の表記は重要です。また、当該ページを印字あるいはダウンロードして手元に補完しておくことも必要です。翌日あなたがアクセスしたときにはNot Foundになっているかもしれませんから。
　(6)「更新時」の方は、ウェブページに「最終更新時：2008年６月○日」という表示があれば、大体はそれを信用してＯＫです。ただし更新時の表示が無い場合、また、表示があってもページの内容とどうも相応しない場合（例：最終更新時は2008年４月だが、首相が小泉純一郎氏だったり安倍晋三氏のままになっているとか）は、閲覧ソフトの機能を使って調べる必要があります。その方法は、次のようなものです。
＜ネットスケープの場合＞
ページの窓で右クリック
→　メニューの小窓が開く
→　「（ページ）情報を表示」をクリック
→　「ページ情報」または「現在のページに関する情報」という窓が開く
→　「最終更新日時」または「変更」の日時をメモる
※厳密には、日本サイトの場合「地方標準時」を、外国サイトの場合は「世界標準時（ＧＭＴ：Greenwich Mean Time）」をメモるのが適当だろう。ちなみに「地方」とはあなたの“国”（つまり日本）の現地時間（ＪＳＴ：Japan Standard Time）。もちろんJSTかGMTのどちらかで時制を統一してもＯＫ。

＜インターネットエクスプローラの場合＞
ページの窓で右クリック
→　メニューの小窓が開く
→　「プロパティ（Ｐ）」をクリック
→　「プロパティ」という小窓が開く
→　「作成日」または「更新日」をメモる。

　こうして確認した「ページの情報」にも最終更新時が表示されない場合や、どうも表示された更新時が怪しい場合（ＩＥはその気味あり）は、「更新時不明」としておきます。
　なお、最終更新時があまりに古い（ネット世界では１年もたっているのは古すぎる）場合、そのウェブページが運営者から忘れられた「化石ページ」である可能性が生じてきます。よって下記の手順で親サイトを確かめる際に、親サイト（玄関ページ）の更新状況もチェックしてください。特に運営者が大学生で、ドメイン（上記説明参照）がその大学のものである場合は要注意です。在学中に制作されたウェブサイトが、学生の卒業後は誰も管理しないまま放置されていることはよくあるからです。

　それでは、以上でそのウェブページについての基礎的データはすべて分かったということで、次には、そのウェブページがどんなウェブサイトに属しているのか、別ページ「親サイト」を確かめに行きましょう。

《以上です》　ページ冒頭へ