地道にハンザイガク

できれば毎日更新,いや,3日に1回更新,いや…

すていぶる あんど ふるーいど ほっとすぽっつ おぶ くらいむ: でぃふぁれんしえーしょん あんど あいでんてぃふぃけーしょん

論文について

  • Johnson, S.D., Lab, S.P. and Bowers, K.j. (2008)
  • Stable and Fluid Hotspots of Crime: Differentiation and Identification
  • Built Environment, 34(1)

メモ

  • ホットスポットの時間的安定性を調査
  • ホットスポットを描くと同じ分布に見えても,temporalな発生パターンによっては対策の仕方が異なると考えられる
    • ホットスポットの特定法でしばしば使われるホットスポット分析は,犯罪の時間的発生パターンを区別するものではない
    • Spellman (1995)では,ホットスポットに使うデータの期間は長い方が将来予測に効くというが,犯罪の変動が見えなくなる
    • 最近の時間的に安定したリスクを反映した安定したホットスポットの検出が重要(警察活動に使う場合においては尚のこと)
  • ある期間内のデータを短い時間間隔(例: 14日)で区切って作成したホットスポットの時系列推移を観察する
    • 期間の全てのデータを用いて作成したホットスポットを"cumulative KDE"と呼ぶ
    • 区切ったホットスポットに対してセルごとの時間方向の変動係数(Coefficient of Variation; CoV)によりホットスポットの安定性を評価する
      • CoVが1より十分に小さい場合: 犯罪の発生は時間的に安定している,1より大きい場合: 犯罪の発生は時間的に安定していない
    • 筆者らが指摘するように,14日以外の区間では結果が異なるかもしれないことに留意(シンプソンのパラドクス,生態学的誤謬を生みかねない)
      • rolling windowで解決する方法もあるが,windowサイズに説明を与える必要がある
  • フィールドはイギリスのマージサイド州
  • 2005/1/1 - 2005/6/30に発生した窃盗(住宅侵入窃盗)が対象,場所は1メートルの解像度で測定されている
  • ホットスポットのグリッド点は50m×50mとし,グリッド内に住宅があるセルのみ使用
    • 住宅の有無はOrdnance Survey(OS)によって記録された測量結果を使用
  • グリッドセルごとにCoVを計算した結果,KDE値の上位5%に位置するセルの中にも犯罪の集中が安定していない(CoVが1より大きい)ものが含まれている
    • 特に上位側のセルは,CoVが大きくなる傾向がある
  • デュアルKDE: 犯罪のKDEを人口のKDEで割ったもの
    • 単に犯罪の多発を示すのでなく,犯罪率として示すことで犯罪機会を考慮することができる
  • 時系列的な変動の影響を加味したKDEの改良方法は,時系列分割した各KDEのzero adjusted logを取る。そうすることである時系列区間の外れ値を影響を抑制できる(外れ値の影響に引きずられなくする)
  • 犯罪の発生に関して場所に何らかの脆弱性がある場合,時間的に安定している場所を対象とした要因分析をしなければならないだろう(1. 安定したホットスポットの特定, 2. crime generator or attractor flagを立てる,3. 定量的分析)
  • この研究で使用したKDEカーネル関数はquartic kernel function

この論文の画期的なところ

  • 犯罪ホットスポットの時間的な変動パターンを定量的に評価したこと
  • 短期間的な多発の影響を加味したKDE方法を提案したこと
  • 単純なKDEとデュアルKDEで時間変動の様相が異なることを示したこと
    • デュアルKDEの方が時間的な安定性が低さが大きくなる

へぇーってなるところ

  • 変動係数でスコアリングしてしまう簡便さは,異なるデータセットでも試しやすいので何かと便利
  • グリッドごとのCoVを求めるのであれば,KDEではなく,グリッドごとの集計値(和)を使っても良かったのではないか?