クラスタリングによる断片的回帰

私は数値データ(3次元以上)を異なるクラスタにクラスタリングし、各クラスタでカーブフィッティングを行い、単一のモデルを使用するよりもはるかに高い精度を得ることができるかどうか疑問に思っていました。 線形回帰が好ましいので、線形近似に基づいてデータ点をクラスタリングする方法はありますか? これは、入力データと一致する結果が必要で、目に見えないデータが気にしないためです。データをハードコードしたり、ルックアップの仕組みを使用することはできません。その代わり、おおよその数学関数が望ましいでしょう。 既存の実&#x8

もっと読む

Deep Belief Networkによって選択された機能の名前を知るにはどうすればよいですか?

DBNを使用して、公称変換後の nslkddデータセットの41個の機能を削減したいデータを数値にすると、フィーチャの数は41から121に増加します。 3つのRBM(121-50-10)を使用しました。これで10個の選択された機能を知りたいと思います。どうすればいい? ベストアンサー 一般に、理論的に入力を再現する10個のフィーチャ、すなわち41個のフィーチャを抽出/作成しています。独自の機能は必ずしも意味をなさないと思われ、(データセットによっては)解釈が難しい場合があります。プリンシパルコンポーネント分析と結果コンポーネントをフィーチャとして比較することができます。 モデルを

もっと読む

1つのクラス分類

私は1クラス分類について読んでいましたが、2つの疑問がありました – 1)訓練データが特定のクラスのみであるため、1クラス分類はどのように機能するのですか。その場合、テスト中に、モデルは常に、そのテストクラスのデータがそのクラスにのみ属すると予測します。 2)スパムメールのデータを持つことができるので、スパム検出には完全ではありませんが、ノンスパムメールのすべてのケースをカバーするためにノンスパムに関するトレーニングデータの量を見つけるにはどうすればよいでしょうか。 一般的な電子メールはスパムではないため、特定

もっと読む

Jaccardを使った検索結果の類似性

私はランキングの位置、キーワード、およびURLを含む一連の検索結果を持っています。私はキーワード(またはURL)をクラスタ化できるように距離行列を作成したいと思います。 1つのアプローチは、各キーワードの最初のn個のURLランキングを取得し、Jaccard類似性を使用することです。しかし、上位のランクを下位のランクよりも高くすることも念頭に置いてください。たとえば、1位と2位に同じURLを持つ2つのキーワードは、39位と40位で同じURLランキングを持つ2つのキーワードよりも似ています。 私は、より高いランクで複数回追加できると示唆していました。たとえ&#x307

もっと読む

自動エンコーダーの畳み込みネットワークフォーカスを視覚化する方法

私は、類似性の比較を行うためにエンコードされた中間層を使用するので、イメージを自動エンコードするために私が使用しているCNNのいくつかのクールな(そして少なくとも幾分意味のある)視覚化を作成しようとしています。 私。私は入力画像を見たいのですが、CNNが “注目している”ことを示す “ヒートマップ”や何かのオーバーレイを付けて、それが理にかなっているかどうかを確認してください。勾配の大きさのようなものがあるかもしれませんが、別のCNNプロジェクトでこれを確認しました。このサイトの例に類似しています – https://rajpurkar.github.io/mlx/visualizing -cnns/ どう&#x3

もっと読む

CSVファイルの最後の列を削除する方法は?

私はこれらのデータから最後のテキスト単語を削除したいと思います。 Pythonでどうすればいいですか? 5.1,3.5,1.4,0.2,Iris-setosa 4.9,3.0,1.4,0.2,Iris-setosa 4.7,3.2,1.3,0.2,Iris-setosa 4.6,3.1,1.5,0.2,Iris-setosa 5.0,3.6,1.4,0.2,Iris-setosa 5.4,3.9,1.7,0.4,Iris-setosa 4.6,3.4,1.4,0.3,Iris-setosa 5.0,3.4,1.5,0.2,Iris-setosa 4.4,2.9,1.4,0.2,Iris-setosa 4.9,3.1,1.5,0.1,Iris-setosa 5.4,3.7,1.5,0.2,Iris-setosa 4.8,3.4,1.6,0.2,Iris-setosa 4.8,3.0,1.4,0.1,Iris-setosa 4.3,3.0,1.1,0.1,Iris-setosa 5.8,4.0,1.2,0.2,Iris-setosa 5.7,4.4,1.5,0.4,Iris-setosa 5.4,3.9,1.3,0.4,Iris-setosa 5.1,3.5,1.4,0.3,Iris-setosa 5.7,3.8,1.7,0.3,Iris-setosa 5.1,3.8,1.5,0.3,Iris-setosa 5.4,3.4,1.7,0.2,Iris-setosa 5.1,3.7,1.5,0.4,Iris-setosa 4.6,3.6,1.0,0.2,Iris-setosa 5.1,3.3,1.7,0.5,Iris-setosa 4.8,3.4,1.9,0.2,Iris-setosa 5.0,3.0,1.6,0.2,Iris-setosa 5.0,3.4,1.6,0.4,Iris-setosa 5.2,3.5,1.5,0.2,Iris-setosa 5.2,3.4,1.4,0.2,Iris-setosa 4.7,3.2,1.6,0.2,Iris-setosa 4.8,3.1,1.6,0.2,Iris-setosa 5.4,3.4,1.5,0.4,Iris-setosa 5.2,4.1,1.5,0.1,Iris-setosa 5.5,4.2,1.4,0.2,Iris-setosa 4.9,3.1,1.5,0.1,Iris-setosa 5.0,3.2,1.2,0.2,Iris-setosa 5.5,3.5,1.3,0.2,Iris-setosa 4.9,3.1,1.5,0.1,Iris-setosa 4.4,3.0,1.3,0.2,Iris-setosa 5.1,3.4,1.5,0.2,Iris-setosa 5.0,3.5,1.3,0.3,Iris-setosa 4.5,2.3,1.3,0.3,Iris-setosa 4.4,3.2,1.3,0.2,Iris-setosa 5.0,3.5,1.6,0.6,Iris-setosa 5.1,3.8,1.9,0.4,Iris-setosa 4.8,3.0,1.4,0.3,Iris-setosa 5.1,3.8,1.6,0.2,Iris-setosa 4.6,3.2,1.4,0.2,Iris-setosa 5.3,3.7,1.5,0.2,Iris-setosa 5.0,3.3,1.4,0.2,Iris-setosa 7.0,3.2,4.7,1.4,Iris-versicolor 6.4,3.2,4.5,1.5,Iris-versicolor 6.9,3.1,4.9,1.5,Iris-versicolor 5.5,2.3,4.0,1.3,Iris-versicolor 6.5,2.8,4.6,1.5,Iris-versicolor 5.7,2.8,4.5,1.3,Iris-versicolor 6.3,3.3,4.7,1.6,Iris-versicolor 4.9,2.4,3.3,1.0,

もっと読む

熱的シミュレーションのパラメータをプログラムで調整して測定データに合わせる

For a university lab I’m required to estimate the thermodynamic constants of a metal by running a series of experiments and adjusting the parameters of a finite difference model to fit the measured data. The experiment consists of an aluminum rod heated at one end, with 5 temperature sensors equally spaced along the length of the rod. I have a simulation of the same setup written in Python that models the temperature of each sensor over time. I also have a large set of experimental data for the temperature of each sensor over time as the rod heats up and cools down. Here’s an example output with the data plotted in black and the simulation plotted in colors: 私はその後、移動平均を使って実験データを整理しました。私の質問は、私のシミュレーションで5つの熱力学的係数を変化させるという課題に、研究室からのデータによく一致するようにアプローチする方法です。私が現在実装している方法を知っている唯一の解決策は、パラメータのすべての組み合わせを順番に調べ、各組み合わせに対してどのような種類のエラー

もっと読む

文中の単語をベクトル形式に変換してモデルを作成する

テキストが question か単に simple message であるかどうかを分類する単純な分類子を構築したいと思います。私はロジスティック回帰を理解し、単純なニューラルネットワークを作成することができます。 私は英語、日本語、韓国語、タイ語でラベル付きの入力データを持っています。このデータをクラシファイアに送る前にこのデータをどのように変換できますか? ベストアンサー アプローチの方法は、データの出現頻度、つまり頻度に応じてデータ内のすべての単語を並べ替えることです。その後、データセットの中で最も頻繁に使用される単語「X」を選択して、データセットの分&#x

もっと読む

畳み込みニューラルネットワークは学習もテストも適切ではない

私は50クラスの画像分類タスクを解決しようとしています。 私は、2万X 50の0と1のマトリックスと2万の画像を持っています。 各写真は4392の1次元ベクトルであり、処理中に形状61X72に変形し、ネットを通過する。 私はネットを通してイメージを渡した後、50個の0と1の1次元ベクトルを各イメージに対して取得し、予測した結果とロードした真の値とを比較したいと思います。 私はこの例を使って構築した畳み込みニューラルネットワークを持っています: https://pythonprogramming.net/cnn-tensorflow-convolutional-nerual-network-machine-learning-tutorial/?completed=/convolutional-neural-network-cnn-machine-learning-tutorial// 私は訓練とテストのために分けるイメージのデータセットを持って&#x30

もっと読む

pandas_datareaderパッケージを正しく使用するには

私はMorningstarやGoogle Financeからいくつかのデータを取得する基本的なプロジェクトをしようとしていますが、GitHubのUsage instructionsに従ってパッケージをインポートし、PycharmでPythonを実行すると、ImportError:is_list_likeという名前をインポートできません私は何をしますか、私は間違ったことをしています。 ベストアンサー BEFORE you import pandas_datareader, run this: pd.core.common.is_list_like = pd.api.types.is_list_like ここで、pdはあなたのパンダの輸入を表します。 この作品が私に教えてください:)

もっと読む