ぼっちだけど、なんとか生きてます。

    駄目人間道。それはアニメやゲームの感想やら欝日記やら統一されていない無法地帯。

    スポンサーサイト 

    上記の広告は1ヶ月以上更新のないブログに表示されています。
    新しい記事を書く事で広告が消せます。

    ( --/--/-- --:-- ) Category スポンサー広告 | コメント(-) | トラックバック(-)

    Hadoop自分メモ 

    探してもアマゾンだったりコマンドラインから呼び出すのばかりだったのでメモ

    物-物のレコメンド
    ユーザID,アイテムID,評点(double?)
    って感じの入力ファイルを用意


     






    ItemSimilarityJob.run
    をEclipseか
    ら呼び出し

    プロパティに設定(入れないと落ちるもの)
    "--input";Textじゃないとダメっぽい?
    "--output";
    "--similarityClassname";類似度算出アルゴリズムクラス名
    SIMILARITY_COOCCURRENCE,
    SIMILARITY_LOGLIKELIHOOD,
    SIMILARITY_TANIMOTO_COEFFICIENT,
    SIMILARITY_CITY_BLOCK,
    SIMILARITY_COSINE,
    SIMILARITY_PEARSON_CORRELATION,
    SIMILARITY_EUCLIDEAN_DISTANCE;
    のどれか(違いはよくわからん)
    "--tempDir";作業ディレクトリ。なぜか知らぬがこれを指定しないと動かぬかった。


    String[] args = {
    "--input",testDir+"/src/test/data/ut/Test/TestALL/testInput",
    "--output",testDir+"/src/test/data/ut/Test/TestALL/outPut",
    // //--maxPrefs
    // "",
    // //--minPrefsPerUser
    // "1",
    // //--maxSimilaritiesPerItem
    // "100",
    //--similarityClassname
    "SIMILARITY_COOCCURRENCE",
    //--tempDir
    testDir+"/src/test/data/ut/Test/TestALL/tempo" };
    ItemSimilarityJob itemJob = new ItemSimilarityJob();
    nCnt = itemJob.run(args);
    とかやればいけた


    入力に使うユーサIDとアイテムIDがLong型のみと気づかなくて悩んだのはまた別のお話し
    …なぜに数値オンリー?誰か教えてエロい人


    関連記事
    スポンサーサイト
    ( 2014/06/08 23:29 ) Category パソコン | コメント(0) | トラックバック(0)
    コメントの投稿













    管理者にだけ表示を許可する
    FC2カウンター
    プロフィール

    Qtarow

    ニックネーム:Qtarow
    誕生日:7月16日
    血液型:A型

    ようこそ我が駄目人間道へ!




    プロフィールページを見る
     

    リンク

    *上(別窓)のメールフォームが表示・動作しない場合はこちら



    上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。