sklearnのRandomForestClassifierによるリアルタイム信号処理

私は、レーダーセンサーからのデータをリアルタイムに判断し、占有を検出しようとしています。同じセンサを使ってデータを生成しました。手動で注釈を付けました。私は列車とテストセットにデータを分割しました。トレーニングデータについては、データをそれぞれ約1秒分のデータに分割しています(使用している機能の一部が範囲や分散などの時間的なものです)。これらのウィンドウをシャッフルして乱数を作成します列車のセット。私はRandomForestClassifierを使ってデータを適合させました。私はテストセットで分類器を実行し、81%の精度を得ました。 私&#x306

もっと読む

多変量時系列に基づく分類・予測

したがって、私は多くの独立変数(X)と結果変数Y(私が予測したいと思う2つのクラスのロジスティック回帰を考えると、出力は1または0のいずれかになります)を持つ時系列を持っています。下記のサンプルを参考にしてください: Timestamp X1 X2 X3 X4 Y 1:00 1 0.5 23.5 0 0 1:01 1 0.8 18.7 0 0 1:02 0 0.9 4.5 1 0 …. 1:30 1 1.9 5.5 1 1 1:31 0 1.7 4.3 0 1 … … 今度は、Yを0(安定)または1(不安定)と予測または分類したい(Yが1になると、一定の時間間隔の間は1になり、0の場合と同じ) したがって、Yはシーケンス変数に依存します(時系列であり、すべての行が分類のためにアルゴリズムに供給される標準的な回帰問題ではなく、ここでの出&#x5

もっと読む

多変量時系列異常エントリ検出

I have a multivariate data set of the following structure. 追加の文字列属性列id1とid2を持つログの時系列シーケンスです。あまりにも多くのエントリがid1またはid2のどちらかの値が似ているシーケンスに入っている場合は、それらを異常として分類してフラグを付けたいと思います。私はLSTMを使用しようとしましたが、特に入力として来ることができる値が常に同じではない(1つの時間枠に他の項目より多くの項目があるかもしれない)ときに、テキストデータのためにそれを使う方法が混乱しています。 同様のエントリは、必ずしも一緒になるとは限りませんが、特定の時間枠内で非常に頻繁に表示さ&#x

もっと読む

限られたデータでn個の期間に予測するためにrnnを使用するにはどうすればよいですか?

だからこれは RNN を介して小さな時系列データセットを実行しようとする私の最初の時間ですが、多くの検索の後、私は見つけることができませんでした、 1. How I can use this to forecast to n periods ? (like in the model.predict(start, end) function in ARIMA.) 2. Is there a better way of doing this using NN ? details on the data is given as comments in the code below. thank you. ”’ total timeseries data points = 39 frequency = Months train = 36 test = 3 Need to forecast 3 periods ahead upto 42, currently using forecast horizon as 1 Limited data so used all in a single batch ”’ periods = 35 f_horizon = 1 batch_size = 35 x_batches = dfp1[ : (len(dfp1) – (len(dfp1) % batch_size))].reshape(-1, periods, 1) # train data for t periods y_batches = dfp1[1 : len(dfp1) – (len(dfp1) % batch_size) + f_horizon].reshape(-1, periods, 1) # train data for t+1 periods #defining test data set def test_data(testdata): test_x = testdata[ :(len(testdata)-1)] # t test_y = testdata[1:len(testdata)] # t+1 return test_x, test_y test_x, test_y = test_data(dfp3[-4: ]) #since 35 points were used in training, used the last 4 points for testing outputs = 1 inputs = 1 hidden = 100 with tf.device(‘/cpu:0’): with tf.variable_scope(‘var’, reuse = tf.AUTO_REUSE): x = tf.placeholder(tf.float32, [None, periods, inputs]) y = tf.placeholder(tf.float32, [None, periods, outputs]) #creating a basic rnn cell basicrnn = tf.nn.rnn_cell.BasicRNNCell(num_units = hidden, activation = tf.nn.relu) rnn_output, states = tf.nn.dynamic_rnn(basicrnn, x, dtype = tf.float32) stacked_rnn_output = tf.reshape(rnn_output, [-1, hidden])

もっと読む

さまざまなピーク形状、サイズ、さまざまなノイズレベル、時にはベースラインのシフトでピークピッキングにアプローチする方法は?

私は絶えず場所をピークに追跡するプログラムを作成しようとしています。これを行うには、私は非常に良いピーク検出アルゴリズムが必要です。それはピークの位置だけでなく、それがないことを伝えなければならない。 ピーク検出のための私の現在のアプローチ: ベースラインを差し引いたもの(異なるベースライン信号のアカウント) 平滑化された信号の標準偏差で除算されます。 すべてのスペクトル(ガウス平滑後の極小値)から候補ピークデータをすべて重ね、1次元(y軸; 2クラスタ、100スペクトル、3000データポイント)でガウス混合を行った。 > イ&#

もっと読む

rの正弦波にフィット

私は次のデータを扱っています。 x <- 1:36 y <- c(6.62,6.57,6.57,6.55,6.52,6.56,6.52,6.55,6.54,6.55,6.55,6.62,6.78,6.73,6.6,6.59,6.57,6.57,6.51,6.55,6.39,6.4,6.15,6.22,6.3,6.27,6.27,6.24,6.24,6.23,6.22,6.26,6.23,6.22,6.2,6.14) y の値は、1月から3年間にわたる月間合計を表します。 1月には( x では1,13,25という値で)比較的大きな y の増加が起こりやすく、1年を通して徐々に低下しています。私はパターンに最もよく合う非対称な正弦波でこの挙動を表現したいと思っています。 このスレッド、私は以下のRコードを実験しました。 mylm <- lm(y ~ x + sin(2*pi/24*x) + cos(2*pi/24*x)) plot(x, y) lines(x, mylm$fitted.values, col = “blue”) 近似はまあまあですが、適合波の対称性は1月の突然の上昇と残りの月間の徐々の減少を捕らえません。 私は、私が求めている波の種類を完全&

もっと読む

Python:時系列のデータが一定のままであるか、増減するかを検出する

私は分析する必要がありますし、後で私は正確な参照データと比較する測定データを改善する(フィルタを統合する)Pythonとします。 最初に、停止、増減状態の間の測定データ全体の平均オフセットと標準偏差を計算します。 参照システムのデータが一定、増減しているセクションを自動的に検出してマークする方法と、この情報を後で統計分析に使用する方法があります。 私はすでに簡単なアルゴリズムを自分で作成しようとしましたが、参照データが正確に与えられているので、2つの隣接するデータポイントの差を計算できるので問題はありません。変&#x531

もっと読む

時系列データのインタラクティブなダッシュボード

私は時系列についての情報を視覚化するためにダッシュボードを構築するためのツールを探しています。このダッシュボードはインタラクティブでなければならず、Webアプリケーション(Webアプリケーションなど)に統合できるようにする必要があります。 私はD3.jsでいくつかのプロジェクトを行いましたが、私が欲しいことをするのは難しいようです。もっと使いやすいものはありますか? ベストアンサー D3(データドリブンドキュメント)は素晴らしいツールですが、JavaScriptにはある程度の時間が必要です。ピギーバックのツールをいくつか用意していますが、意欲的なデー&#x30BF

もっと読む

あなたはベクトル自己回帰モデルのビジネスアプリケーションの例を提供できますか?

ベクトル自己回帰モデルは、世界中の経済学部で利用されています。彼らは深く複雑ではないが、予測の問題を解決する単なる統計モデルです。 しかし、驚いたことに、それが純粋な経済学の領域外で、つまり私たちみんなのようなビジネス問題を解決するために使用されたという証拠はありません – データ科学者 – そうです。 ビジネス上の問題を解決するためのVARの適用経験か、仮説的に使用できるシナリオか、それがビジネス環境で簡単に適用できない理由を述べるか(これが目的、数学的/経験的に根拠のある理由なら、この方法の採用が遅い理由につ

もっと読む

リカレントニューラルネットワーク(LSTM)を実稼働環境で実行できますか?

私はLSTM細胞に基づいてRNNについて質問します。現在、私は予測誤差に基づいて、時系列データの異常を予測しようとしています。プロダクションで配布されたRNNを実行することは合理的ですか?たとえば、Google Cloud ML Engineでスケールするなどです。 私は、推論の間に多くの要求を計算しなければならない場合に備えて、モデルをスケールすることができるようにしたい。 しかし、私がモデルを配布するとき、メモリセルに何が起こるでしょうか?データは分割され、複数のノードに分散されますが、それでも時系列データのパターンは認識されますか? Thnx! ベストアンサー 申し訳あり

もっと読む