Damerau–Levenshtein距離尺度を用いたログファイルにおける異常検知

近年、ログファイルの自動または半自動解析を支援するための研究が数多く行われてきた。特に、ニューラルネットワークに基づくアルゴリズムが多数提案されている。本論文では、ニューラルネットワークに依存しないログ異常検知のための新しいアプローチを提案する。本手法を構成する要素は、機械学習分野において以前から知られているものである。

著者らは、ログシーケンス間の類似度を定量化するために、重み付きDamerau–Levenshtein距離尺度を用いることを提案している。さらに、**k近傍法(kNN)**に基づく半教師ありログ異常検知アルゴリズム、および HDBSCAN に基づく教師なし手法を提示する。後者については、必要に応じて人間のドメイン専門家がシーケンスのラベルを修正できるよう、手動フィードバック機構を組み込むことでアルゴリズムを拡張している。

論文情報
Horvath, G., Mészáros, A., Charaf, K., Szilágyi, P. (2026).
Detecting anomalies in log files using the Damerau-Levenshtein distance metric.
Data Mining and Knowledge Discovery, Vol. 40.
DOI: 10.1007/s10618-025-01182-8

👉 論文全文:
https://www.researchgate.net/publication/399652190_Detecting_anomalies_in_log_files_using_the_Damerau-Levenshtein_distance_metric

log-parsers-transform-log-lines-to-log-templates

f1-scores-of-the-semi-supervised-algorithm-on-hdfs-as-the-function-of-k-and-the-weighted

f1-scores-of-the-semi-supervised-algorithm-on-bgl-as-the-function-of-k-and-the-weighted

f1-scores-of-the-semi-supervised-algorithm-on-pbs-mom-as-the-function-of-k-and-the

comparison-of-the-semi-supervised-results-with-other-solutions-error-bars-show-95

お電話 Zalo
Loading...