Haskell vs Ruby

(2008.9.25 新規作成)

刺激的なタイトルにしてみましたが、どちらがいいとか悪いとか、という話ではありません。あしからず。

Haskell の特徴を調べるために、手続き型言語のRubyと比較してみようと思います。

ループ

変数の再代入やオブジェクトの破壊的な変更ができない Haskell ではループが書けません。

はるか昔、goto文が悪とされ、構造化プログラミングとしてgotoを使わないようになりました。goto文があればどのようなフローでも書けましたが、それに代わってwhileやforでループを書くようになりました。不自由ですが、ソースコードが明瞭になり、他人が書いたものでも読みやすくなりました。

変数への再代入が禁止されることで、ある変数が参照する値が勝手に変わることもなく、よりプログラムが読みやすくなります。ちょっと私はまだその境地には達していませんが。

ループのようなことは再帰で書きます。Haskell (に限らずたいていの最近の言語) では、再帰は可能であれば、gotoと同じ動作に変換されるので、効率も悪くありません。

Haskell
[RAW]
  1. fn x = if x == 1 then 1
  2. else x * fn (x - 1)
  3. main = print $ fn 10

Rubyでループを使って書くとこうでしょうか。

Ruby
[RAW]
  1. def fn x
  2. r = 1
  3. for i in 2..x do
  4. r *= i
  5. end
  6. r
  7. end
  8. puts fn(10)

こんなに短いとどちらが読みやすいも何もないですが、規模が大きくなると、変数の値が一つに決まるというのは安心感がある、かもしれません。

高階関数

関数型プログラミングでは高階関数を使いまくります。

リストの各要素に対して関数を適用してその結果のリストを作る、リストの要素に関数を適用して真になったものだけでリストを作る、リストを畳み込む、などなど、様々なパターンがあらかじめ組み込み関数などで用意されていて、その引数として自分で書いた関数を与えます。

例えば filter 関数は、最初の引数として関数を取り、その関数が真を返すリストを返します。

Haskell
[RAW]
  1. fn x
  2. | x `mod` 3 == 0 = True
  3. | otherwise = False
  4. main = print $ take 5 $ filter fn [1..]

実行結果:

[3,6,9,12,15]

Rubyではブロックを使います。Rubyのブロックは、メソッドの引数として関数(クロージャ)を渡すためのシンタックスシュガーです。

Ruby
[RAW]
  1. p (1..15).select {|x|
  2. x % 3 == 0
  3. }

Rubyでもブロックを使いまくりますし、この辺は差が出ません。ただ、打ち切り条件の書き方に違いがあります。

内側と外側の逆転

Haskell は遅延評価 (lazy evaluation) で式を評価(実行)します。遅延評価は、データのうち、実際に必要になった部分しか使われません。

ループというかコードの内側で無限リストを使い、ループの外側に打ち切り条件を書く、ということができます。

例えばリストの最初の5つを得るときは、次のように書きます。

Haskell
[RAW]
  1. main = print $ take 5 [1..]

take によって必要とされる最初の5要素だけが評価されます。lazyでない、引数を先に評価する言語ではこれは完了しません。

Rubyだとこうです。

Ruby
[RAW]
  1. r = []
  2. i = 0
  3. while true
  4. r << (i += 1)
  5. break if i >= 5
  6. end
  7. p r

あまりにも短いので作為的ですが、とにかく、ループの内側に脱出条件を書く、というのがポイント。

私が Haskell を練習していたとき、このような逆転で、腸が捩れるような感覚になりました。

例題:素因数分解

少しだけ大きな題材として、大きな数の素因数分解をしてみます。

問題文は Project Euler から持ってきました (Problem 3)。

The prime factors of 13195 are 5, 7, 13 and 29. What is the largest prime factor of the number 600851475143 ?

正の整数nを素因数分解するごく簡単な方法は、2から√n までの素数で割り切れるかどうか試すものです。

素数は、エラトステネスの篩(ふるい)で生成できます。

Rubyで書いた1回目。これはダメすぎな例です。

Ruby
[RAW]
  1. number = 600851475143
  2. # エラトステネスの篩 (ふるい) で素数リストを作成
  3. def prime_while max
  4. rest = Array.new(max - 1) {|i| i + 2}
  5. max_s = Math.sqrt(max).floor
  6. while (prime = rest.shift)
  7. return if !(yield prime)
  8. rest.delete_if {|i| (i % prime) == 0}
  9. break if prime > max_s
  10. end
  11. rest.each {|x|
  12. return if !(yield x)
  13. }
  14. end
  15. puts Time.now
  16. x = number
  17. prime_while (Math.sqrt(number).floor) {|pn|
  18. break if x == 1
  19. while x % pn == 0
  20. print "#{pn} "
  21. x /= pn
  22. end
  23. true
  24. }
  25. print "\n"
  26. puts Time.now

私の機械で、ちょうど1分ぐらい掛かりました。

次は Haskellで書いたもの。

Haskell
[RAW]
  1. number = 600851475143
  2. -- number = 34
  3. {- (1) 素数を求める
  4. 無限リストを用意し、2 を取り除いて、
  5. 2で割り切れないのだけ残したリストを作って、
  6. 再帰的に呼び出す。
  7. -}
  8. primes' (p:xs) = p : (primes' $ filter (\x -> x `mod` p /= 0) xs)
  9. primes :: [Integer]
  10. primes = primes' [2..]
  11. {- (2) 素因数分解する
  12. 単に、割って、再帰呼び出しする
  13. -}
  14. facto :: Integer -> [Integer] -> [Integer]
  15. facto n (pn:pns)
  16. | n == 1 = []
  17. | floor (sqrt (fromInteger number)) < pn = [n]
  18. | n `mod` pn == 0 = pn : (facto (n `div` pn) (pn:pns))
  19. | otherwise = facto n pns
  20. main = do
  21. print $ facto number $ primes

非常に短くなりました。

Haskell が遅延評価する、というところが重要で、素数を求める部分は無限リストを返しますが、効率が悪くなることがありません。primes' にも無限リストを与えていますが、これも大丈夫です。

実行すると一瞬で答えが出ます。

ただし、これをもってHaskellのほうが速い、というのは早計です。Ruby版は、篩(ふるい)のために 775,000 の要素を持つ配列を作っています。しかも素数を求める過程で詰めたりしています。

次のようにプロファイルを取ってみると、Array#initialize がほとんどの時間を占めています。アホです。

$ ruby -rprofile 003.rb

では、どうするのがいいでしょうか。

素数かどうか不明な配列をあらかじめ用意するのではなく、素数かどうか調べたい数値について、素数の倍数でないか試し、当たらなかったら新しい素数です。効率化のために、素数の次の倍数にマークを付けるのがよさそうです(テストしたときにマークする先を替えていく)。

クロージャを使って面白い書き方をされている方がいましたので、貼り付けます(少し修正しました)。

Ruby
[RAW]
  1. class MyPrime
  2. include Enumerable
  3. def initialize
  4. @hash = {}
  5. @n = 1 # 直前の素数
  6. end
  7. # 次の素数を返す
  8. def succ
  9. n = @n
  10. while true
  11. n += 1
  12. if (s = @hash[n])
  13. s.call()
  14. @hash.delete(n)
  15. else
  16. # n は素数
  17. i,j = n,n
  18. f = Proc.new {
  19. k = i + j
  20. if (g = @hash[k])
  21. g.call()
  22. end
  23. @hash[k] = f
  24. j += n
  25. }
  26. f.call()
  27. @n = n
  28. return n
  29. end
  30. end
  31. end
  32. alias next succ
  33. def each
  34. g = MyPrime.new
  35. while true
  36. yield g.succ
  37. end
  38. end
  39. end
  40. x = 600851475143
  41. p Time.now
  42. gen = MyPrime.new
  43. while pn = gen.next
  44. break if x == 1
  45. while x % pn == 0
  46. print "#{pn} "
  47. x /= pn
  48. end
  49. end
  50. print "\n"
  51. p Time.now

今度は一瞬です。

比べてみると、

  • Haskell のほうがずいぶん短いコードになった。
  • Rubyではパフォーマンスを考えて作り込まなければならない。もちろん作り込めばRubyのほうが速いコードが書けるが、このぐらいの問題だとHaskellでは何も考えなくてもコンパイラがそこそこのコードを出力する。

問題の種類にもよるのでしょうけど、Haskell のほうが効率よく書ける可能性がありそうです。