SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

分析関数の衝撃

分析関数の衝撃(完結編)

CodeZineに掲載されたSQLを分析関数で記述する 4

  • X ポスト
  • このエントリーをはてなブックマークに追加

ダウンロード ソースコード (4.6 KB)

関係除算を表現する

 次に関係除算を表現するSQLについて考えます。「SQLで集合演算」では、以下のSQLが提示されています。

差集合で関係除算(剰余を持った除算)
SELECT DISTINCT emp
  FROM EmpSkills ES1
 WHERE NOT EXISTS
        (SELECT skill
           FROM Skills
         minus
         SELECT skill
           FROM EmpSkills ES2
          WHERE ES1.emp = ES2.emp);

 これを分析関数で書き換えてみます。まずは、テーブルのデータと、出力結果を考えます。

Skillsテーブル
Skill
Oracle
UNIX
Java
EmpSkillsテーブル
EmpSkill
相田Oracle
相田UNIX
相田Java
相田C#
神崎Oracle
神崎UNIX
神崎Java
平井UNIX
平井Oracle
平井PHP
平井Perl
平井C++
若田部Perl
渡来Oracle
出力結果
Emp
相田
神崎

 手続き型の言語であれば、次のような手順となるでしょう。

  1. SkillsテーブルのSkillを配列に保存し、それぞれにフラグを用意
  2. EmpSkillsテーブルをEmpの昇順にソート
  3. 配列に保存したSkillsテーブルのSkillのフラグを初期化
  4. EmpSkillsテーブルをEmpの最小値からループ開始
  5. 配列に保存したSkillsテーブルのSkillにフラグをつける
  6. EmpSkillsテーブルのEmpがブレイクしたら、3に戻る

 分析関数を使ったSQLでも似たような考え方を使います。

分析関数で書き換えたSQL(Skillsテーブルが空集合の場合に非対応)
select a.Emp
  from EmpSkills a,(select Skill,
                    count(*) over() as SkillCount
                      from Skills) b
 where a.Skill = b.Skill
group by a.Emp,b.SkillCount
having count(*) = b.SkillCount;

 where句で内部結合して、group byでグループ化を行った後のイメージは、次のようになります。

group byでグループ化した状態のイメージ
group byでグループ化した状態のイメージ

 この後、having句の条件としてcount(*) = b.SkillCountを指定しています。必要なスキルの数を示すb.SkillCountは全て3ですから、相田さんと神埼さんのみが返されます。ただし、Skillsテーブルが空集合の場合、上記のSQLではデータが出力されません。これを考慮したSQLは次のようになります。

分析関数で書き換えたSQL(Skillsテーブルが空集合の場合に対応)
select a.Emp
  from EmpSkills a Left Join (select Skill,
                              count(*) over() as needCount
                                from Skills) b
                     on 1=1
group by a.Emp,b.needCount
having count(decode(a.Skill,b.Skill,1)) = nvl(b.needCount,0);

 Left Join句で外部結合して、group byでグループ化を行った後のイメージは、次のようになります(27行目以降は割愛)。

group byでグループ化した状態のイメージ
group byでグループ化した状態のイメージ

 having句では、decode関数を使ってa.Skillb.Skillが一致するレコードの数と、Skillsテーブルのレコードの数が等しいか判定しています。これは、count関数がnullをカウント対象としないことへの考慮です。

 外部結合の結合条件には1=1を指定し、判定結果が必ずtrueとなるように記述しています。Skillsテーブルが空集合でない場合は、全ての行と結合した結合結果(クロスジョインと同じ結合結果)が返されます。また、Skillsテーブルが空集合の場合は、結合先の情報をnullとした結合結果が返される仕組みです。

 Skillsテーブルが空集合の場合は、having句の条件式の左辺のcount(decode(a.Skill,b.Skill,1))0、右辺のnvl(b.needCount,0)0となるため、having句において等号が成立し、EmpSkillsテーブルの全てのEmpが出力されます。

 Oracle10gの新機能「Partitioned Outer Join」を使用した別解(Skillsテーブルが空集合の場合に非対応)も記載しておきます。

Partitioned Outer Joinを使用した別解
select b.Emp
  from Skills a
  Left Join EmpSkills b
 partition by (b.Emp)
    on (a.Skill = b.Skill)
group by b.Emp
having count(*) = count(b.Skill);

次のページ
等しい部分集合を見つける

この記事は参考になりましたか?

  • X ポスト
  • このエントリーをはてなブックマークに追加
分析関数の衝撃連載記事一覧

もっと読む

この記事の著者

山岸 賢治(ヤマギシ ケンジ)

趣味が競技プログラミングなWebエンジニアで、OracleSQLパズルの運営者。AtCoderの最高レーティングは1204(水色)。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

  • X ポスト
  • このエントリーをはてなブックマークに追加
CodeZine(コードジン)
https://codezine.jp/article/detail/1593 2008/07/22 14:00

おすすめ

アクセスランキング

アクセスランキング

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング