近年、ログファイルの自動または半自動解析を支援するための研究が数多く行われてきた。特に、ニューラルネットワークに基づくアルゴリズムが多数提案されている。本論文では、ニューラルネットワークに依存しないログ異常検知のための新しいアプローチを提案する。本手法を構成する要素は、機械学習分野において以前から知られているものである。
著者らは、ログシーケンス間の類似度を定量化するために、重み付きDamerau–Levenshtein距離尺度を用いることを提案している。さらに、**k近傍法(kNN)**に基づく半教師ありログ異常検知アルゴリズム、および HDBSCAN に基づく教師なし手法を提示する。後者については、必要に応じて人間のドメイン専門家がシーケンスのラベルを修正できるよう、手動フィードバック機構を組み込むことでアルゴリズムを拡張している。
論文情報
Horvath, G., Mészáros, A., Charaf, K., Szilágyi, P. (2026).
Detecting anomalies in log files using the Damerau-Levenshtein distance metric.
Data Mining and Knowledge Discovery, Vol. 40.
DOI: 10.1007/s10618-025-01182-8





