| 語1 | 語2 | スコア | 共起ページ数 |
|---|
| Azure | OpenAI | 3.231386 | 33 |
| arxiv | org | 2.777729 | 20 |
| abs | org | 2.777729 | 20 |
| gpt | turbo | 2.739034 | 27 |
| Wav2vec | XLS | 2.511339 | 18 |
| https | 論文URL | 2.426347 | 20 |
| arxiv | https | 2.426347 | 20 |
| domain | pre | 2.360671 | 12 |
| ランダムなワードベクトルから始め | ワードベクトルの学習方法については | 2.360671 | 12 |
| ランダムなワードベクトルから始め | 損失関数を定義し | 2.360671 | 12 |
| その負の方向に小さなステップを進めることで | 現在のパラメータから勾配を計算し | 2.360671 | 12 |
| その負の方向に小さなステップを進めることで | 損失関数を最小化する方向に進んでいきます | 2.360671 | 12 |
| ステップサイズは調整可能で | 損失関数を最小化する方向に進んでいきます | 2.360671 | 12 |
| ステップサイズは調整可能で | 小さすぎると計算が多くなり | 2.360671 | 12 |
| 大きすぎると最適解に収束しない可能性があります | 小さすぎると計算が多くなり | 2.360671 | 12 |
| ニューラルネットワークは一般的に凸ではないため | 最適解が一意でない可能性がありますが | 2.360671 | 12 |
| 実際には問題なく動作します | 最適解が一意でない可能性がありますが | 2.360671 | 12 |
| intermediate | steps | 2.339014 | 11 |
| arxiv | 論文URL | 2.24613 | 15 |
| abs | arxiv | 2.24613 | 15 |
| dense | shot | 2.126852 | 12 |
| Eは | VALL | 2.126852 | 12 |
| Pseudo | data | 2.03404 | 8 |
| 110M | のEncoder | 2.03404 | 8 |
| Aデータです | 今回使用するデータは東京都立大学のeラーニングシステムのQ | 2.03404 | 8 |
| Aデータです | このデータは | 2.03404 | 8 |
| Aデータを収集したものです | このデータは | 2.03404 | 8 |
| 427の質問と79の回答が含まれています | Aデータを収集したものです | 2.03404 | 8 |
| 427の質問と79の回答が含まれています | 質問にどの回答に紐づくかのラベルがあります | 2.03404 | 8 |
| データの様子は下記の通りです | 質問にどの回答に紐づくかのラベルがあります | 2.03404 | 8 |
| 評価指標は以下の3つです | 評価方法は以下の3つのステップです | 2.03404 | 8 |
| その結果としては | 今回はRAGのRetrieverの性能を比較しました | 2.03404 | 8 |
| One | hot | 2.03404 | 8 |
| CourseraのAndrew | 勾配降下法について詳しく知りたい方は | 2.03404 | 8 |
| CourseraのAndrew | Ng先生の機械学習の授業の受講を強くおすすめします | 2.03404 | 8 |
| Ng先生の機械学習の授業の受講を強くおすすめします | 勾配降下法とは | 2.03404 | 8 |
| 勾配降下法とは | 現在のパラメータ | 2.03404 | 8 |
| の値を持ち | 現在のパラメータ | 2.03404 | 8 |
| の値を持ち | 学習率またはステップサイズ | 2.03404 | 8 |
| を使用して勾配の負の方向に少し移動します | 学習率またはステップサイズ | 2.03404 | 8 |
| これらはベクトルであり | 新しいパラメータ値が得られます | 2.03404 | 8 |
| これらはベクトルであり | 各個別のパラメータは | 2.03404 | 8 |
| これが単純な勾配降下法のアルゴリズムです | 各個別のパラメータは | 2.03404 | 8 |
| 全コーパスを用いて損失関数やその勾配を計算すると | 非常に時間がかかり | 2.03404 | 8 |
| 一度の勾配更新に長い時間を要するため | 非常に時間がかかり | 2.03404 | 8 |
| 一度の勾配更新に長い時間を要するため | 最適化が極めて遅くなります | 2.03404 | 8 |
| の場合 | ニューラルネットワークではほぼ100 | 2.03404 | 8 |
| の場合 | 勾配降下法ではなく確率的勾配降下法 | 2.03404 | 8 |
| SGD | 勾配降下法ではなく確率的勾配降下法 | 2.03404 | 8 |
| SGD | が用いられます | 2.03404 | 8 |