誤字/その他のパタ​​ーンを学び予測するアルゴリズム

私は1つのチャネルから他のチャネルに渡す取引データを持っています。このプロセスでは、データにスペルミスや誤植が発生する可能性があります。たとえば、チャネルAのデータにpre_prefixがあり、チャネルBにpost_prefixがあるとします。したがって、データは次のようになります pre_to_city post_to_city pre_bank_name post_bank_name pre_Currency/instructed amount post_Currency/instructed_amount fix Ontario Ontarios CitiBank CitiBank Currency:CAD Amount:#6354 Currency:CAD Amount: Entered the missing amount/rectified the city 今私は、データのパターンを学び、将来のデータに必要な修正を予測するアプローチを考え出す必要があります。大部分のデータはテキストなので、私はword2vec/embeddingsで特徴ベクトルを形成し、これらのベクトルを使ってCNN /ラン&#x30C

もっと読む

クラスタリング/アクションと時間のシーケンスに基づいてユーザーを分類する

私はいくつかのユーザデータを持っています。各ユーザは、ある時間別の場所にいるというパターンを持っています。私はこれらのパターンとそれぞれの場所で費やされた時間に基づいてこれらのユーザーをクラスター化/分類するモデルを作成したいと考えています。だから、ユーザーのパターンは、 Place_1(60分) – Place_2(30分) – Place_5(45分) – ユーザー1 – ラベル(1)       Place_1(60分) – Place_2(60分) – Place_5(45分) – ユーザー2 – ラベル(2)       Place_1(60分) – Place_2(60分) – Place_5(40分) – ユーザー3 – ラベル(2)       Place_2(60分) – Place_1(60分) – Place_5(45分) – ユーザー4 – ラベル(3)

もっと読む

パターンとパターンのモデル?

類似のパターン/イメージを生成するモデルを作成するにはどうすればよいですか? 増強後に400個のエクスプレプルがあれば、どうすればいいのでしょうか? This is the kind of data I have (16X16) 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0 0,0,0,0,1,1,1,1,1,0,0,0,0,0,0,0 0,0,0,0,1,5,2,2,1,0,0,0,0,0,0,0 0,0,0,0,1,2,3,3,1,0,1,1,1,0,0,0 0,0,0,0,1,2,3,2,1,0,1,7,1,0,0,0 0,0,0,0,1,1,1,2,1,1,1,7,1,0,0,0 0,0,0,0,0,1,1,2,2,2,2,7,1,0,0,0 0,0,0,0,0,1,2,2,2,1,2,2,1,0,0,0 0,0,0,0,0,1,2,2,2,1,1,1,1,0,0,0 0,0,0,0,0,1,1,1,1,1,0,0,0,0,0,0 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0 私はDLのために行くことを試みたが、私は例に私の手を得ることができない。 乾杯:)) ベストアンサー 申し訳ありませんが、適切な答えはありません

もっと読む

異常なシーケンシャルユーザ行動の検出

私は、一連の通常のユーザーセッションを含むデータセットを持っています。各セッションには、N個のシステムリソース{R1、…、RN}上の順序付けられたユーザー要求のスイートが含まれています。 私は、各要求コマンドでユーザーIDを確認することによって、連続認証アルゴリズムを設計したいと考えています。より正確に言えば、私はユーザーにセッション全体(すべてのコマンドシーケンス)を認証させないようにしますが、データセットの以前の通常のシーケンスに基づいて、各リソース要求コマンドでこれを実行します。 どのようにして異常なものを&#x30E

もっと読む

可変長シーケンスの収集と解説:検索問題

私は厳しい問題があり、助言が必要です。 私が可変長シーケンスのコレクションを持っていて、その多くがユニークであるとします。チェスゲームへの動きを想像してください。    d4 Nf6    c4 g6    Nc3 Bg7    e4 d6    Nf3 O-O    Be2 c5    O-O Bg4    … このコレクションの各アイテムについて、私は人間が生成した別のコレクションを持っています(コメント – comment_1: “クールなゲーム”、comment_2: “すごい犠牲” ) 目標は、コメントとシーケンスの間の関連付けをマイニングして、検索目的のために人間が読めるラベルでシーケンスにタグを付けることです。 私は、ラベルの生成+シーケンスの&#x30AF

もっと読む

k-はマルコフ連鎖確率にクラスタリングすることを意味する

私は50人の生徒のデータセットを持っています。私は彼らのシーケンシャルデータ上でそれらをクラスタリングしたい(彼らは複数のシーケンスA、B、Cの合計7つのステージに従って仕事をしている間)。私はk-meansクラスタリングを1次マルコフ連鎖確率確率行列に適用する予定です。つまり、私は50,7×7の遷移確率行列を持っています。各7×7行列は49データ点を有する。だから、私は50×49の行列を作ることができます。このマトリックスにk-手段を適用すると、シーケンシャルデータをクラスタリングするための適切なアプローチですか? ベストアンサー 申し訳ありませんが、適切な答

もっと読む