Hateburo: kazeburo hatenablog

SRE / 運用系小姑 / Goを書くPerl Monger

Starlet + Server::Stater で UNIX domain socketに対応しました

Starlet-0.21がリリースされました。

Starlet-0.21 - a simple, high-performance PSGI/Plack HTTP server - metacpan.org - Perl programming language

このバージョンからServer::Staterとの組み合わせでUNIX domain socketをListenすることができるようになりました。

$ start_server --path /tmp/app.sock -- plackup -s Starlet app.psgi

Server::Stater は以前からUNIX domain socketをサポートしていたのですが、Starlet側でうまくハンドリングできていなかったのを修正したのが今回のリリースです。

ベンチマーク

#plackconでの発表にもある通り、UNIX domain socketを使うとTCPで接続するよりもよいベンチマーク結果が得られます。

f:id:kazeburo:20131126002528p:plain

このベンチマークはEC2のm3.2xlargeを使い、nginxとStarletを以下のように起動してwrkを使って計測しました。

wrkの起動はこんな感じ。

$ ./wrk -c 300 -t 4 -d 10 http://localhost:8080/
TCPの場合

Starletの起動

$ start_server --port 5000 -- carton exec -- plackup -E production \
  -s Starlet --max-reqs-per-child 5000 --min-reqs-per-child 4000 \
  --max-workers 10 -a app.psgi

nginx.conf

upstream apps {
     server 127.0.0.1:5000;
}
server {
    listen 8080;
    server_name _;
    etag off;
    location / {
        proxy_set_header Host $host;
        proxy_pass http://apps;
    }
}
UNIX domain socketの場合

Starletの起動

$ start_server --path /tmp/app.sock -- carton exec -- plackup -E production \
  -s Starlet --max-reqs-per-child 5000 --min-reqs-per-child 4000 \
  --max-workers 10 -a app.psgi

nginx.conf

upstream apps {
     server unix:/tmp/app.sock;
}
server {
    listen 8080;
    server_name _;
    etag off;
    location / {
        proxy_set_header Host $host;
        proxy_pass http://apps;
    }
}

どうぞご利用くださいませ

ISUCON3 予選のAMIでスコア 65000点以上を出す方法 #isucon

ISUCON3 の予選AMIが公開されてから、ごにょごにょとHackした結果、スコアで65000まで出す事ができました。(一回だけ66000でけどたぶんインスタンスガチャ)

ISUCON 本戦出場者決定のお知らせ」をみると予選の時のトップのスコアが3.3万(自分たちは1.5万ぐらい)、その後の解説記事「ざっくりと #isucon 2013年予選問題の解き方教えます」だと、5.6万という話でしたので、その数字よりも良いスコアを出すことができました。

んで、本選終わったのでそのソースコード公開しました。

https://github.com/kazeburo/isucon3qualifier-myhack

構成はnginx + perlです。主なポイントは

  • セッションに直接ユーザIDを埋める
  • / と /recent は静的にHTMLを書き出して、nginxのssiを使ってセッション情報を埋める。
  • 初期化時とmemoのPOST時に、memcachedにJSONでキャッシュする
  • /memo はluaでmemcachedにアクセスして組み立てる
  • 改造Starlet使って、nginxからunix domain socketでproxy

といったあたり。ベンチマークはworkload 2よりも大きくすると遅くなります

$ sudo isucon3 benchmark --init /home/isucon/webapp/perl/conf/init.sh --workload 2
2013/11/11 14:49:42 <<<DEBUG build>>>
2013/11/11 14:49:42 benchmark mode
2013/11/11 14:49:42 initialize data...
2013/11/11 14:49:57 run /home/isucon/webapp/perl/conf/init.sh timeout 60 sec...
2013/11/11 14:50:32 done
2013/11/11 14:50:32 sleeping 5 sec...
2013/11/11 14:50:37 run benchmark workload: 2
2013/11/11 14:51:38 done benchmark
Result:   SUCCESS 
RawScore: 65508.9
Fails:    0
Score:    65508.9

最後まで @methane さんの70kには届かなかったのが残念

Kossy-0.24 Trial has been released. It contains new BodyParser

I released Kossy-0.24-Trial. It contains new request-body parser Kossy::BodyParser.

https://metacpan.org/release/KAZEBURO/Kossy-0.24-TRIAL

Kossy::BodyParser is based on tokuhirom's Plack::BodyParser
https://github.com/plack/Plack/pull/434

I think that this trial version of Kossy is positioned as verification of the next Plack.

Benchmark

package MyApp;

use strict;
use warnings;
use Kossy;

get "/" => sub {
    my ( $self, $c )  = @_;
    $c->response->body("ok");
};

router [qw/GET POST/] => "/bench" => sub {
    my ( $self, $c )  = @_;
    my $param = $c->req->param('q');
    $c->response->body("ok => " . $param);
};

package main;

use HTTP::Request::Common;
use HTTP::Message::PSGI;
use Plack::Test;
use Plack::Builder;
use Benchmark qw/cmpthese timethese/;

my $env = req_to_psgi(GET '/');
my $env_get = req_to_psgi(GET '/bench?q=HTTP%3A%3ARequest%3A%3ACommon&ie=UTF-8&sourceid=chrome');
my $env_post = req_to_psgi(POST '/bench',
                           [ q=>'HTTP::Request::Common', ie => 'UTF-8', sourceid => 'chrome' ] );
my $app = MyApp->psgi;

warn $Kossy::VERSION;

cmpthese(timethese(0,{
    'kossy_noparam' => sub {
        $app->($env);
    },
    'kossy_get' => sub {
        $app->($env_get);
    },
    'kossy_post' => sub {
        $app->($env_post);
    },
}));

Results

0.23
Benchmark: running kossy_get, kossy_noparam, kossy_post for at least 3 CPU seconds...
 kossy_get:  4 wallclock secs ( 3.26 usr +  0.00 sys =  3.26 CPU) @ 11825.46/s (n=38551)
kossy_noparam:  3 wallclock secs ( 3.23 usr +  0.00 sys =  3.23 CPU) @ 12707.43/s (n=41045)
kossy_post:  3 wallclock secs ( 3.02 usr +  0.00 sys =  3.02 CPU) @ 11577.81/s (n=34965)
                 Rate    kossy_post     kossy_get kossy_noparam
kossy_post    11578/s            --           -2%           -9%
kossy_get     11825/s            2%            --           -7%
kossy_noparam 12707/s           10%            7%            --
0.24
Benchmark: running kossy_get, kossy_noparam, kossy_post for at least 3 CPU seconds...
 kossy_get:  3 wallclock secs ( 3.21 usr +  0.00 sys =  3.21 CPU) @ 12763.24/s (n=40970)
kossy_noparam:  3 wallclock secs ( 3.11 usr +  0.00 sys =  3.11 CPU) @ 13610.29/s (n=42328)
kossy_post:  3 wallclock secs ( 3.29 usr +  0.00 sys =  3.29 CPU) @ 12449.85/s (n=40960)
                 Rate    kossy_post     kossy_get kossy_noparam
kossy_post    12450/s            --           -2%           -9%
kossy_get     12763/s            3%            --           -6%
kossy_noparam 13610/s            9%            7%            --

アプリケーションに手を入れずに #isucon 2013 予選のperlアプリケーションのスコアをあげてみようの巻

ということで、やってみた。

初期

オンライン予選で使用した問題が手元で再現できるAMIを公開しました」に書かれているAMIを使って起動し、まず、初期状態でのベンチマークを取ってみる。

2013/10/28 14:21:18 done benchmark
Result:   SUCCESS 
RawScore: 865.9
Fails:    0
Score:    865.9

disble?

たぶんミスだと思うのですが、Starmanの起動オプションがdisbleになっていたので修正

- command=/home/isucon/env.sh carton exec -- plackup -s Starman --workers 10 --port 5000 -E production --disble-keepalive app.psgi
+ command=/home/isucon/env.sh carton exec -- plackup -s Starman --workers 10 --port 5000 -E production --disable-keepalive app.psgi

supervisorctl reloadしてベンチマークを動かすとかなり結果がよくなった

2013/10/28 14:24:15 done benchmark
Result:   SUCCESS 
RawScore: 1857.9
Fails:    0
Score:    1857.9

Monoceros & OpenFileCache

次にこのエントリで紹介した、Monoceros と Plack::Middleware::Static::OpenFileCacheをいれる。

diff --git a/app.psgi b/app.psgi
index 2fb2ba5..220fd06 100644
--- a/app.psgi
+++ b/app.psgi
@@ -13,7 +13,7 @@ my $root_dir = File::Basename::dirname(__FILE__);
 my $app = Isucon3::Web->psgi($root_dir);
 builder {
     enable 'ReverseProxy';
-    enable 'Static',
+    enable 'Static::OpenFileCache',
         path => qr!^/(?:(?:css|js|img)/|favicon\.ico$)!,
         root => $root_dir . '/public';
     enable 'Session',
diff --git a/cpanfile b/cpanfile
index 25ca66c..21fe478 100644
--- a/cpanfile
+++ b/cpanfile
@@ -9,3 +9,11 @@ requires "DBD::mysql";
 requires "Starman";
 requires "Plack::Session";
 requires "Cache::Memcached::Fast";
+
+requires "Monoceros", 0.26;
+requires "EV";
+requires "Guard";
+requires "Sys::Sendfile";
+requires "Linux::Socket::Accept4";
+requires "Plack::Middleware::Static::OpenFileCache";

HelloWorldなベンチマークではStarmanよりMonocerosの方が速いっていうのと、sendfileによって静的画像のレスポンスがよくなるのを狙った。

supervisord.condを書き換えて

- command=/home/isucon/env.sh carton exec -- plackup -s Starman --workers 10 --port 5000 -E production --disable-keepalive app.psgi
+ command=/home/isucon/env.sh carton exec -- plackup -s Monoceros --workers 10 --port 5000 -E production --disable-keepalive app.psgi

ベンチマーク

2013/10/28 14:35:00 done benchmark
Result:   SUCCESS 
RawScore: 1925.2
Fails:    0
Score:    1925.2

ちょっとスコアあがった。
Starletでも同程度になったので、sendfileは影響ない感じでした。

Kossy 0.23

Kossy 0.23uri_forとResponse->finalizeの最適化が入っているのでアップデート

diff --git a/cpanfile b/cpanfile
index 21fe478..78d7bf9 100644
--- a/cpanfile
+++ b/cpanfile
@@ -1,4 +1,4 @@
-requires "Kossy", 0.19;
+requires "Kossy", 0.23;
 requires "DBIx::Sunny";
 requires "JSON::XS";
 requires "Digest::SHA";

また少しスコアあがる

2013/10/28 14:38:03 done benchmark
Result:   SUCCESS 
RawScore: 2012.7
Fails:    0
Score:    2012.7

Plack::Middleware::Session::Simple

ここで紹介した、セッション周りの改善。keep_emptyを無効にして空のセッションを保存しない、Set-Cookieを行わないようにした

diff --git a/app.psgi b/app.psgi
index 220fd06..2c98b6a 100644
--- a/app.psgi
+++ b/app.psgi
@@ -16,16 +16,12 @@ builder {
     enable 'Static::OpenFileCache',
         path => qr!^/(?:(?:css|js|img)/|favicon\.ico$)!,
         root => $root_dir . '/public';
-    enable 'Session',
-        store => Plack::Session::Store::Cache->new(
-            cache => Cache::Memcached::Fast->new({
-                servers => [ "localhost:11211" ],
-            }),
-        ),
-        state => Plack::Session::State::Cookie->new(
-            httponly    => 1,
-            session_key => "isucon_session",
-        ),
+    enable 'Session::Simple',
+        store => Cache::Memcached::Fast->new({
+            servers => [ "localhost:11211" ],
+        }),
+        httponly => 1,
+        cookie_name => "isucon_session",
+        keep_empty => 0,
     ;
     $app;
 };
diff --git a/cpanfile b/cpanfile
index 78d7bf9..78d3475 100644
--- a/cpanfile
+++ b/cpanfile
@@ -15,5 +15,5 @@ requires "EV";
 requires "Guard";
 requires "Sys::Sendfile";
 requires "Plack::Middleware::Static::OpenFileCache";
+requires "Plack::Middleware::Session::Simple";

もうちょいスコア増えた。

2013/10/28 14:46:10 done benchmark
Result:   SUCCESS 
RawScore: 2131.1
Fails:    0
Score:    2131.1

まとめ

初期 865.9 から 2131.1 と約2.5倍ぐらいの改善となりました!やった!

ちなみに同じインスタンス上で、rubyのアプリケーションを動かした場合のスコアは

2013/10/28 15:05:04 done benchmark
Result:   SUCCESS 
RawScore: 2386.1
Fails:    0
Score:    2386.1

何が違うんだろう..

Monoceros-0.26 and Plack::Middleware::Static::OpenFileCache

Monoceros-0.26 uses sendfile(2) for sending file if Sys::Sendfile is available.

https://metacpan.org/release/Monoceros

Plack::Middleware::Static::OpenFileCache can cache opened file handles like nginx's open_file_cache. Static::OpenFileCache also caches the whole of files if content size is less than buf_size.

https://metacpan.org/release/Plack-Middleware-Static-OpenFileCache

# synopsis

use Plack::Builder;
builder {
    enable Static::OpenFileCache,
        path=>sub{s{^/static/}{}},
        root=>"/path/to";
    $app
}

benchmark

benchmark on Macbook Air.

benchmark client
$ ab -c 1 -n 5000  http://127.0.0.1:5000/static/jquery-1.10.2.min.js

jquery-1.10.2.min.js has 93KB length.

server
$ plackup -E production -s Monoceros --workers 1 --max-reqs-per-child 50000 \
  -e 'enable Static::OpenFileCache, path=>sub{s{^/static/}{}},root=>"./";sub{}'
benchmark results

f:id:kazeburo:20131028135020p:plain

Of course, I recommends to use reverse-proxy for serving static-files in the production.

Plack::Middleware::Session::Simple has been released

English document is available on metacpan!



Plack::Middleware::Session::Simpleをリリースしました。Plack::Middleware::Session(Store::Cache & State::Cookie)と互換性を保ちながら、効率よく動作することを狙っています。

  • 必要なときに必要なだけ Set-Cookie ヘッダを発行する
  • 必要なときだけストレージにアクセスする

弊社のようなハイトラフィックなサービスを運営している場合には、できるだけリソースをケチりたいので、そういう思想なものが必要となった。互換性があるので負荷が低いところで使っても問題が起きないと思う。

使い方

Plack::Middleware::Sessionで以下のように設定していたなら、

my $cache = Cache::Memory::Simple->new;
builder {
    enable 'Session',
       store => Plack::Session::Store::Cache->new(
            cache => $cache,
        ),
        state => Plack::Session::State::Cookie->new(
            session_key => 'myapp_session'
        );
    $app
}

Session::Simpleではこうなる。Plack::Session::(Store|State)がなくなり、一部のオプションの名前が変更になっている。

builder {
    enable 'Session::Simple',
        store => $cache,
        cookie_name => 'myapp_session',
        keep_empty => 0 # 0にすると空のセッションを保存しない&Cookieを送出しない
    ;
    $app
};

キャッシュに保存する内容は同じなので、ミドルウェアの入れ替えによってセッションが切れたりすることはない。

StickyQuery のサポートについて

URI based session management は、セキュリティ上も問題があるし、Cookie を送信しないような DoCoMo の古い端末はもはや無視できると判断し、サポートしない。 必要であれば Plack::Middleware::Session をご利用いただけばよい。