アーキテクチャにおけるレイテンシー問題のトラブルシューティングに必要なデータを収集するのに役立つOSSの分散型トレースシステム
Zipkinは分散型トレースシステムです。サービスアーキテクチャにおけるレイテンシー問題のトラブルシューティングに必要なタイミングデータの収集を支援します。
特徴として、データの収集とルックアップの両方があります。
ログファイルにトレースIDがあれば、直接ジャンプすることができます。そうでない場合は、サービス、操作名、タグ、期間などの属性に基づいてクエリーを実行することができます。あるサービスに費やされた時間の割合や、操作に失敗したかどうかなど、興味深いデータが要約されます。
Zipkin UIは、トレースされたリクエストが各アプリケーションをどれだけ通過したかを示す依存関係ダイアグラムも表示します。これは、エラーパスや非推奨のサービスの呼び出しを含む集約的な動作を特定するために役立ちます。
Zipkinにトレースデータを報告するために、アプリケーションは「instrumented」である必要があります。
これは通常、トレーサーやインスツルメンテーションライブラリを設定することを意味します。Zipkinにデータを報告する最も一般的な方法は、Apache ActiveMQ、gRPC、RabbitMQなど他の多くのオプションが存在するものの、HTTPまたはKafkaを経由することです。UIに提供されるデータは、インメモリに保存されるか、Apache CassandraやElasticsearchのようなサポートされているバックエンドで永続的に保存されます。
クラウドサービスのリサーチ・導入・運用代行など、併走型ITコンサルティングについてお気軽にご相談ください。
日々のリサーチ、クラウドサービスの導入・運用など、ITインフラの整備やDX / デジタルトランスフォーメーション業務でお困りですか?
利益を創出するためのオペレーションにおいて、今出来ていないこと、面倒なこと、他社ではコストが高いことなど、お気軽にご相談ください。