研究室の日常5<クロス集計ってどんなもの?>

私の所属する研究室では、2,3週に一度、修士以上の学生で集まって自主的なゼミが開催されています。(目的は、論文を書く時に使うデータ分析等の手法の勉強です)

本日から4回に渡って、1月に行われたゼミの様子をご紹介します。(1/4)
1月学生ゼミテーマ
1.クロス集計 2.アソシエーション分析
3.決定木分析 4.クラスター分析

学生ゼミシリーズ

第1回:相関分析ってどんなもの?
第2回:回帰分析ってどんなもの?
第3回:交差検証ってどんなもの?
第4回:χ2乗検定ってどんなもの?
第5回:クロス集計ってどんなもの?(今回)


研究室メンバー

toku:サイト管理人 M1 専門は住宅、リフォーム

mo: M1 専門はコミッショニング

yu: M1 専門はゼネコンの海外進出

tamu: D1 学生最年長 専門はPM、意思決定

テーマ: クロス集計

ゼミの進め方
1.最初に一人が分析手法の概要を話す
2.他メンバーが実際にその手法が使用された論文のレビューを行う

0.クロス集計概要(担当:tamu)

それでは久しぶりに、学生ゼミを始めま~す

今日のテーマがクロス集計、アソシエーション分析、決定木分析、クラスター分析の4つですね

うん、じゃあクロス集計からやります

クロス集計
与えられたデータの中から複数個の項目を抽出してデータ分析や集計を行う手法のことである。クロス集計を利用すると、複数の項目を掛け合わせて集計することにより、収集したデータをさまざまな角度から分析でき、項目相互の関係を明らかにできる(参考:Weblio辞書)

クロス集計は、あまり言うことがないのですけど、要するに属性別に内容を分類してアンケートを取ることに名前をつけたものです。例えば「内閣支持率に性差や年齢差が関係あるか調べる」というような。


図1 内閣支持率を例にしたクロス集計の見本(出典:クロス・マーケティング、[onlien]https://www.cross-m.co.jp/column/marketing/util58/)

これをもとに因子分析など各種の分析を行う、大前提みたいなもの。相関分析をする手前に行うもので、稀にクロス集計だけで終わることもあるけれど。妥当性があるか見るときには使う。
今日の4つの分析は何かの分析の前か後に使うものが多いけれど、クロス集計は前に使うタイプ。

アンケート調査でクロス集計しないなんてこと、ほとんどない印象なんだけどね。自由記述の場合もあるけど

クロス集計って、誰かが後から名前をつけたんですかね

そうじゃない?

(多分)表自体は昔からあったでしょうけど、統計学として体系的されたのは最近なのでは?

1.論文 Number1(担当:toku)

住宅や居間の広さの実態とその満足感および望ましい広さに関するアンケート調査」(外部サイト)
吉田氏による、住宅や居間の広さと満足感の関係を調べた論文です。

研究の背景としては、3大都市圏への人口集中に伴い、効率よく空間を使う住宅が多くなった。そうした住宅では、限られた空間を広く感じる様々な工夫が必要である。ただ居住空間は広ければ広いほどよいというわけではないし、どれくらいが適切なのだろうかということを調べた調査です。
この論文は単純集計とクロス集計の両方が載っているので取り上げました

住宅の種類や、延床面積、居間の面積、広さの印象等、9項目程度についてアンケートを行ってます。
3ページ目以降でクロス集計を行ってまして、結論としては「居間は自分が住んでいる20㎡~30㎡の空間より少し広いくらいがよかった」「40㎡以上だと、かえって満足度が下がる」という結果がでてます

4頁の、住宅属性ごとのグラフ。この「集合持家」というのは分譲か。賃貸、分譲、戸建ての3種類

比較的に賃貸だと、分相応というか、狭くても満足度が高くて、他2つは要求水準が上がりますね
ただ、ほぼ自分が住んでいる家を望ましい広さと考えている
図11の左のところ、20㎡の戸建てがどんな家なのか気になりますが

某劇的大改造に登場する物件みたい

回答した人が平米とツボを取り違えたんだろうとは思うんですけど…

逆に、80㎡とか100㎡とか、どんな賃貸なのか…

タワーマンションとかの3LDKだと、パイプスペース含めたらそれくらいいくんじゃない?(3LDKでよくある専有面積は70㎡~80㎡)

これ技術報告集なんだね、なんで分析がないのかなって思ったけど。アンケートでどうですかと聞いただけで、内容が正しいか考察がないんだけどね

技術報告集は論文とどう違うんですか?

技術報告集は、名前の通り「技術者」の方が書くもので、言葉は悪いけど求められる水準が違うのね。
技術報告集は、論文じゃなくて「報告」だから、忙しい技術者でもそこまで負担をかけずに書ける、技術者が意見を出せる場所。普段から仕事で忙しいけど、社会に思うところがあるからこういうのを書くわけ。

この後に、論文として繋げるならここからどう展開するんですか?

これは入り口で止まってるから、例えばアンケート結果の妥当性を数理的に検証するとか。例えば、前回の内容にあった「交差検証」とか使ったら解ける(=妥当性が把握できる)んじゃないですか?(研究室の日常3<交差検証ってどんなもの?>

2.論文 Number2(担当:mo)

京町家の証券化?

町家は結構、収益性が取りにくいらしく、再生事業の難易度は高いみたいです。不動産証券化で、よりバリューアップがやりやすくなったというか

改修費用が出しにくかったからファンドを作った?

日本の場合、政府が主導してやったわけじゃなくて、アメリカとか外資系の投資銀行が安く買い叩いて始まったから、不動産の証券化はその制度として一応あるわけで。
それを京町家でやるのは実際難しいけど、この論文で挙げてる事例は何故か上手く行った。論文の目的は、「さほど好条件でないのに順調に出資が得られ(中略)本事例が実現した要因を整理することであり、(中略)今後の保存・再生手法の議論における論点を提示する」というもの

成功要因の抽出なんですね、事例は何件ですか?

3件です

狭く深く?

そう、クロス集計を使っているのは表1、表2、表3。
結論は、結びに書いてあるけど、「試行的といわざるを得ない」、つまりこれを一般化するのは難しい、ということですね

成功要因を明らかにするんですよね?成功要因はどこに書いてある?

たぶん、6の評価と政策的な含意、影響要因分析

京町家の再生を強く望んでいる人も、配当率は問題でないとしてるのに、原本割れでもいいといっている人はほぼいないという(笑)配当率1%は低いのかな?

REITの利回りはどれくらいだったかな…でも1%は絶対値として低いかな(Jリートの分配金利回りは、2017年8月時点で約4%、東証1部株式配当利回りは約1.5%)

結局、出資者のモチベーションが高いから成功したみたいな感じだな

3.論文 Number3(担当:yu)

これ概要かな?グラフ無いけど

いえ、これ書評ですね

「クロス風景の結果、上記類型の順が後になるほど(難易度が低下するほど)、就職活動が不活発で、内定獲得時期は遅くなり、大企業からの内定が少なくなっていた」
このときはクロス集計した後に、多変量解析して、決定要因を分析したんですね、アンケートだけで書ける内容じゃない。
目的があってアンケートして、クロス集計して、数理的な分析したらこういう結論が出たと。
しかし内容が酷すぎる…「大学の偏差値が低いほど、就活のやる気がない」ってことやんこれ。そんなこと言われてもと思わへん?建設的じゃねえ

これは誰が書いた…あ、大学教授の人なのか

フリーター含め、若年就業研究の第一人者な。指標の妥当性まで指摘してる

結構、この取組については評価してますね

こんな研究してる人、この人くらいしかいないよね、とっても意味があるよねって。
ここでの多変量解析ってという意味で使ってるんやろね、重回帰分析のことなのか。主成分分析、因子分析、クラスター分析…

これだけではなんとも

前:χ二乗検定
次:アソシエーション分析

参考

1)クロス集計は分析の基本! | リサーチ・市場調査 | クロス・マーケティング、[online]https://www.cross-m.co.jp/column/marketing/util58/
2)吉田圭志、佐藤仁人(2014)「住宅や居間の広さの実態とその満足感および望ましい広さに関するアンケート調査」日本建築学会技術報告集、第20巻第45号、p611-616
3)丸谷浩明、木下信、坪田建明(2007)「京町家証券化の出資者意向調査からみた保存再生ファイナンスのあり方の考察」日本不動産学会誌、第21巻第2号、pp87-97
4)マーケット概況|J-REIT.jp | Jリート(不動産投資信託)の総合情報サイト | ARES J-REIT View、[online]https://j-reit.jp/market/03.html
5)永野仁(2008)「書評と紹介 : 小杉礼子編『大学生の就職とキャリア : 「普通」の就活・個別の支援』」大原社会問題研究所雑誌. 2008年(12月)(601)

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください