象と戯れ

 | 

2011-11-25

SQL Server 2012の記事がひどすぎる件

14:26 | SQL Server 2012の記事がひどすぎる件 - 象と戯れ を含むブックマーク はてなブックマーク - SQL Server 2012の記事がひどすぎる件 - 象と戯れ

まあ今に始まったことではないかもしれませんが。。。

SQL Server 2012の全貌が見えてきた!新ライセンス体系、高可用性、見える化、インメモリ、そしてビッグデータ (2/3):EnterpriseZine(エンタープライズジン)

Enterpriseエディションならではの機能としてカラムベースのインデックス処理技術である「カラムストアインデックス」がある。Excel/SharePointのアドインである多次元インメモリ機能「PowerPivot」のカラムベースエンジン(VertiPack)をベースに、列(カラム)単位のインデックス格納を実現、データの圧縮率を大幅に高め、パフォーマンスを劇的に向上させる機能だ。斎藤氏によれば「件数にもよるが、フルテーブルスキャンに比べて100倍以上は高速になる」とのこと。日次集計など参照処理を行うデータウェアハウジングにおいて大幅な処理性能向上が期待できる。

カラム単位のインデックスって普通じゃね?インデックスって普通カラムに対して貼るものだよね??五味さんって以前もPostgreSQLかなんかの記事で意味不明なことを書いていた記憶があるからまあ記者なんてそんなもんだよねと思っていたら、Microsoftのページにも「Columnstore Index」って書いてあったなんだかなと思ったり。

Sign in to your Microsoft account

でよく読んでみると列圧縮(カラムコンプレッション)のことなんだと思う。ただしGreenplumのそれと違って元のテーブルはそのまま保存して列圧縮したデータを別に作るんだろうと思われる。なので「インデックス」と呼んでいるんだと思うんだけど、それって本質的にインデックスじゃないよね?? どっちかっていうとVerticaのマテリアライズドビューに近い気がする。だいたいあれですよ、Clustered Indexって奴だって、それ意味あるの??みたいな話でしょ。

ちなみに列圧縮はBIデータベースでは割とホットでして、元々列指向のVerticaやSybaseはともかく、Netizza、Teradata、Greenplumもサポート(予定)しており、ないと列強に加われないという明治時代の軍艦みたいなものです。あ、Oracle(Exadata)もサポートするとかしたとか。

Teradata Columnar and Teradata 14 compression | DBMS?2 : DataBase Management System Services

Jim Gray亡き今というか彼がいたからSQL ServerがBIっぽくなっちゃっただけで、MySQLみたいに「そういうのは関係ないですから」っていう方向を進めばよかったのに。

ジム・グレイ - Wikipedia

閑話休題。

AlwaysOnでは、最大4台のセカンダリサーバに複製可能で、自動/手動によるフェールオーバーが可能だ。セカンダリは同期モードと非同期モードに設定することができ、同期モードに設定すると「アクティブセカンダリ」として稼働させることができる。いつでもプライマリに取って代われるセカンダリ、という位置づけだ。これにより処理を負荷分散させながらコンピューティングリソースを使うことが可能で、高い可用性を維持できるという。デモでは東京⇔大阪間でのフェールオーバーが行われた場合、ダウンタイム15秒程度でセカンダリがプライマリのロールを引き継いで稼働するデモが実演された。ほぼリアルタイムの同期といっていいだろう。

15秒!?15秒でリアルタイムって呼んでいいの??何千件というトランザクションが消える(失敗する)と思うんですけど、いいんですね。それでいいんですね。WALをディスクに書くか、メモリに書くかですったもんだ議論しているPostgreSQLのレプリケーションはがんばりすぎですかね。もちろんフェイルオーバーが透過的にできるのは大事なことだと思いますけど、15秒ってひどくないですか。しかも最大4台とか。「カスケードしてもいい?」とかおちゃめなことを言ってるFujiiさんが泣きます。

まー総じてSQL Serverのテクノロジっていつの時代もこんなかんじで「えっ?」って話が多いような気がするけど、実際自分がその業界に行ってみてわかった、SQL ServerをBIで使ってるところはないに等しい(笑)もちろん小規模でOLTPと並行でBIツールと使ってるところはあるけれども、大規模でいうと Teradata、Oracle、Netizza、Greenplum、たまにSybaseとかAsterとかVerticaとかいう話はあっても、SQL Serverはないね。それでも大企業のバックエンドでWindowsサーバーと抱き合わせで使ってる人たち、かわいそうになあ、っていつも思うけど。Jとか。レプリケーションの怠慢っぷりに何度となく泣かされておりましたもので。まったくMSの誇大広告には目に余るものがある・・・

 |