RegularizedBetaBinomialMixtureEM.java example

Explorer

jml-master
- jmll-master
  - experiments
    - src
      - main
        java
        com
        spbsu
        bernulli
        EM.java
        FittedModel.java
        Learner.java
        MCMCBernoulliMixture
        BernoulliPrior.java
        LLPrior.java
        MCMCBernoulliEstimation.java
        UniformPrior.java
        Mixture.java
        MixtureObservations.java
        Multinomial.java
        StochasticSearch.java
        betaBinomialMixture
        BetaBinomialMixture.java
        BetaBinomialMixtureEM.java
        RegularizedBetaBinomialMixtureEM.java
        caches
        BetaCache.java
        Digamma1Cache.java
        DigammaCache.java
        naiveMixture
        BernoulliMixtureEM.java
        NaiveMixture.java
        crawl
        GameProcess.java
        StartCrawl.java
        WSEndpoint.java
        bl
        Event.java
        GameSession.java
        Hero.java
        Mob.java
        crawlSystemView
        HeroView.java
        InventoryView.java
        MapView.java
        MobsListener.java
        MobsView.java
        PlayerActionView.java
        StatusView.java
        Subscribable.java
        SystemView.java
        events
        HeroListener.java
        InventoryListener.java
        MapListener.java
        PlayerActionListener.java
        StatusListener.java
        SystemViewListener.java
        helpers
        CategoricalFeaturesMap.java
        CodeSet.java
        map
        CrawlGameSessionMap.java
        Layer.java
        Position.java
        PositionManager.java
        TerrainType.java
        data
        Command.java
        Message.java
        Protocol.java
        impl
        CoordinateMessage.java
        FlavourMessage.java
        InputCommandMessage.java
        InputModeMessage.java
        KeyCode.java
        KeyCommand.java
        KeyMessage.java
        MonsterInfoMessage.java
        PackedCellMessage.java
        PackedUnsignedLong.java
        PlayerInfoMessage.java
        UpdateMapCellMessage.java
        UpdateMapMessage.java
        system
        EmptyFieldsDefault.java
        GameEnded.java
        GameStarted.java
        GoLobbyMessage.java
        IgnoreMessage.java
        LobbyComplete.java
        LoginMessage.java
        LoginSuccessMessage.java
        MenuMessage.java
        PingCommand.java
        PongMessage.java
        RegisterMessage.java
        SetGameLinks.java
        StartGameMessage.java
        StartSpectateMessage.java
        UpdateMenuMessage.java
        learning
        FeaturesBuilder.java
        HeroFeaturesBuilder.java
        InventoryFeaturesBuilder.java
        LearnDataBuilder.java
        State.java
        StatusFeaturesBuilder.java
        features
        CategoricalFeature.java
        Feature.java
        NumericalFeature.java
        sessions
        WeightedRandomWalkGameSession.java
        utils
        GenerateCppEnumWriter.java
        direct
        BroadMatch.java
        gen
        SimpleGenerativeModel.java
        WordGenProbabilityProvider.java
        exp
        modelexp
        Experiment.java
        Model.java
        Query.java
        Setup.java
        Stat.java
        User.java
        managers
        SerpManager.java
        WizardManager.java
        setup
        SimpleExclusive.java
        users
        FeedbackUser.java
        UniformUser.java
        UserFactory.java
        multiclass
        spoc
        GreedyCML.java
        RunnerECOC.java
        SearchAvaliableMxMath.java
        SearchMCGreedyAllParams.java
        SearchMCMathAllParams.java
        SearchMCParams.java
        full
        mx
        bruteforce
        FullMatrixLearning.java
        optimization
        ECOCMulticlass.java
        SeparatedMLLLogit.java
        tools
        FeatureFrequency.java
        Runner.java
        region
        ExperimentsRunner.java
        wiki
        CreateWikiCharDict.java
      - test
        java
        com
        spbsu
        exp
        BernoulliTest.java
        DispersionTest.java
        Java8ParallelStreamsTest.java
        PGMEMLogDataTest.java
        StreamsBenchmark.java
        multiclass
        DiplomaGradFacTest.java
        ECOCComboTest.java
        GradFacTest.java
        HierClassTests.java
        SPOCMethodTest.java
        weak
        CustomWeakBinClass.java
        CustomWeakMultiClass.java
  - ml
    - src
      - main
        java
        com
        spbsu
        ml
        BFGrid.java
        BinModelWithGrid.java
        BinOptimizedModel.java
        Binarize.java
        BlockedTargetFunc.java
        BlockwiseFuncC1.java
        CompositeTrans.java
        DynamicGridEnabled.java
        GridEnabled.java
        GridTools.java
        JMLLCLI.java
        ProgressHandler.java
        RankIt.java
        TargetFunc.java
        Vectorization.java
        cli
        JMLLCLI.java
        builders
        data
        DataBuilder.java
        impl
        DataBuilderClassic.java
        DataBuilderCrossValidation.java
        methods
        MethodsBuilder.java
        grid
        DynamicGridBuilder.java
        GridBuilder.java
        impl
        BootstrapOptimizationBuilder.java
        FMWorkaroundBuilder.java
        GradientBoostingBuilder.java
        GreedyObliviousTreeBuilder.java
        GreedyObliviousTreeDynamic2Builder.java
        GreedyObliviousTreeDynamicBuilder.java
        GreedyTDBumpyRegionBuilder.java
        GreedyTDCherryRegionBuilder.java
        GreedyTDRegionBuilder.java
        LassoGreedyObliviousTreeBuilder.java
        MultiClassSplitBuilder.java
        MultiClassSplitGradFacBootstrapBuilder.java
        MultiClassSplitGradFacBuilder.java
        MultiClassSplitGradFacFilterBuilder.java
        MultiClassSplitGradFacSvdNBuilder.java
        MultiClassSplitOneVsRestBuilder.java
        MultiLabelConflictBuilder.java
        MultiLabelSubsetsBuilder.java
        MultiLabelWrapperBuilder.java
        RandomForestBuilder.java
        RegionForestBuilder.java
        RidgeGreedyObliviousTreeBuilder.java
        RidgeRegressionLeavesObliviousTreeBuilder.java
        cv
        FoldsEnumerator.java
        KFoldCrossValidation.java
        gridsearch
        GridSearch.java
        OptimumHolder.java
        ParametersExtractor.java
        ParametersGridEnumerator.java
        modes
        AbstractMode.java
        impl
        Apply.java
        ConvertPool.java
        ConvertPoolJson2Classsic.java
        ConvertPoolLibSvm.java
        CrossValidation.java
        Fit.java
        GridSearch.java
        PrintPoolInfo.java
        SplitJsonPool.java
        ValidateModel.java
        ValidatePool.java
        output
        ModelWriter.java
        printers
        DefaultProgressPrinter.java
        HistogramPrinter.java
        MultiLabelLogitProgressPrinter.java
        MulticlassProgressPrinter.java
        ResultsPrinter.java
        clustering
        ClusterizationAlgorithm.java
        GenericClusterizationAlgorithm.java
        impl
        ConnectedComponentOptimizer.java
        ForelAlgorithm.java
        GenericNearestNeighborAlgoritm.java
        KMeansAlgorithm.java
        NearestCentroidAlgorithm.java
        NearestCentroidDRAlgorithm.java
        NearestNeighborAlgoritm.java
        NearestNeighborDRAlgorithm.java
        cuda
        CudaException.java
        JCublasHelper.java
        JCudaConstants.java
        JCudaHelper.java
        JCudaMemory.java
        JCurandHelper.java
        data
        ArrayBased.java
        impl
        FloatMatrix.java
        FloatVector.java
        root
        array
        VectorScale.java
        nn
        Dropout.java
        data
        Aggregate.java
        DSIterator.java
        StatisticCalculator.java
        cherry
        CherryBestHolder.java
        CherryLoss.java
        CherryPick.java
        CherryPointsHolder.java
        CherryStochasticSubset.java
        CherrySubset.java
        impl
        BinarizedDataSet.java
        RankedDataSet.java
        set
        DataSet.java
        VecDataSet.java
        impl
        VecDataSetImpl.java
        softBorders
        GibbsExpWeightedPermutationsWalker.java
        Sampler.java
        stats
        OrderByFeature.java
        tools
        BinModelBuilder.java
        BinarySaver.java
        DataTools.java
        DynamicBinModelBuilder.java
        FakePool.java
        FeaturesTxtPool.java
        HierTools.java
        MCTools.java
        MultiLabelTools.java
        Pool.java
        PoolBuilder.java
        PoolByRowsBuilder.java
        SmallPoolReader.java
        SubPool.java
        dynamicGrid
        AggregateDynamic.java
        impl
        BFDynamicGrid.java
        BinarizedDynamicDataSet.java
        BinaryFeatureImpl.java
        MedianRow.java
        StaticRow.java
        interfaces
        BinaryFeature.java
        DynamicGrid.java
        DynamicRow.java
        models
        BinDynamicOptimizedModel.java
        ObliviousTreeDynamicBin.java
        trees
        BFDynamicOptimizationSubset.java
        GreedyObliviousTreeDynamic.java
        GreedyObliviousTreeDynamic2.java
        factorization
        Factorization.java
        impl
        ALS.java
        ElasticNetFactorization.java
        SVDAdapterEjml.java
        StochasticALS.java
        func
        BiasedLinear.java
        Ensemble.java
        FuncEnsemble.java
        FuncJoin.java
        Linear.java
        NormalizedLinear.java
        ScaledFunc.java
        TransJoin.java
        generic
        ChainProbSum.java
        Const.java
        ElementaryFunc.java
        Identity.java
        Log.java
        Logit.java
        MultiLogit.java
        ParallelFunc.java
        Pow.java
        ReLU.java
        Sigmoid.java
        SubVecFuncC1.java
        Sum.java
        SumSigmoid.java
        WMultiLogit.java
        WSum.java
        WSumSigmoid.java
        io
        BFGridStringConverter.java
        DynamicGridStringConverter.java
        EnsembleModelConversionPack.java
        FMModelConversionPack.java
        FuncEnsembleConversionPack.java
        FuncJoinConversionPack.java
        JoinedBinClassModelConversionPack.java
        JoinedProbsModelConversionPack.java
        ModelsSerializationRepository.java
        MultiClassModelConversionPack.java
        MultiLabelBinarizedModelConversionPack.java
        ObliviousMultiClassTreeConversionPack.java
        ObliviousTreeConversionPack.java
        ObliviousTreeDynamicBinConversionPack.java
        RegionConversionPack.java
        TransJoinConversionPack.java
        loss
        CELogit.java
        ChooseComplimentLLLogit.java
        CombL2.java
        ComplementLLLogit.java
        CompositeFunc.java
        CorrL2.java
        DSSumFunc.java
        DSSumFuncC1.java
        DSSumFuncComposite.java
        ExclusiveComplementLLLogit.java
        F1Logit.java
        FBetaLogit.java
        L2.java
        L2GreedyTDRegion.java
        L2Reg.java
        LL.java
        LLLogit.java
        LLX2.java
        LOOL2.java
        LogL2.java
        MLL.java
        MLLLogit.java
        PLogit.java
        RLogit.java
        SatL2.java
        ShiftedL2.java
        ShiftedLLLogit.java
        StatBasedLoss.java
        WeightedL2.java
        WeightedLLLogit.java
        WeightedLoss.java
        blockwise
        BlockwiseL2.java
        BlockwiseMLLLogit.java
        BlockwiseMultiLabelLogit.java
        BlockwiseSatL2.java
        BlockwiseStatBasedLoss.java
        BlockwiseWeightedLoss.java
        multiclass
        ClassicMulticlassLoss.java
        MCMacroF1Score.java
        MCMacroPrecision.java
        MCMacroRecall.java
        MCMicroF1Score.java
        MCMicroPrecision.java
        MCMicroRecall.java
        util
        ConfusionMatrix.java
        MultilabelConfusionMatrix.java
        MultilabelExampleTableOutput.java
        MultilabelThresholdPrecisionMatrix.java
        multilabel
        ClassicMultiLabelLoss.java
        MultiLabelExactMatch.java
        MultiLabelHammingLoss.java
        MultiLabelMacroFScore.java
        MultiLabelMicroFScore.java
        MultiLabelOVRLogit.java
        meta
        DSItem.java
        DataSetMeta.java
        FeatureMeta.java
        PoolFeatureMeta.java
        TargetMeta.java
        impl
        FeatureMetaImpl.java
        JsonDataSetMeta.java
        JsonFeatureMeta.java
        JsonTargetMeta.java
        PoolFeatureMetaImpl.java
        TargetFeatureImpl.java
        fake
        FakeFeatureMeta.java
        FakeTargetMeta.java
        items
        FakeItem.java
        FocusItem.java
        QURLItem.java
        ViewportAnswersWeighting.java
        methods
        BootstrapOptimization.java
        ElasticNetMethod.java
        FMTrainingWorkaround.java
        GradientBoosting.java
        LARSMethod.java
        LASSOMethod.java
        LassoGradientBoosting.java
        LassoRegionsForest.java
        MTA.java
        MultiClass.java
        MultipleVecOptimization.java
        Optimization.java
        PGMEM.java
        RandomForest.java
        SeqOptimization.java
        StochasticGradientDescent.java
        VecOptimization.java
        greedyMergeOptimization
        GreedyMergePick.java
        MergeOptimization.java
        ModelComparators.java
        RegularizedLoss.java
        RegularizedLossComparator.java
        greedyRegion
        AdditiveStatisticsExtractors.java
        BFOptimizationRegion.java
        BFWeakConditionsOptimizationRegion.java
        BFWeakConditionsStochasticOptimizationRegion.java
        BinaryRegion.java
        GreedyPolynomialExponentRegion.java
        GreedyRegion.java
        GreedyTDBumpyRegion.java
        GreedyTDIterativeRegion.java
        GreedyTDLinearRegion.java
        GreedyTDRegion.java
        GreedyTDRegionNonStochasticProbs.java
        GreedyTDWeakRegionMTA.java
        RegionBasedOptimization.java
        RegionForest.java
        cherry
        GreedyTDCherryRegion.java
        OutLoss.java
        OutLoss2.java
        OutLoss3.java
        cnfMergeOptimization
        CherryOptimizationSubset.java
        CherryOptimizationSubsetMerger.java
        GreedyMergedRegion.java
        ModelComplexityCalcer.java
        linearRegressionExperiments
        EmpericalBayesRidgeRegression.java
        MultipleEbsRidgeRegression.java
        MultipleLeastAngle.java
        MultipleRidgeRegression.java
        MultipleValidationRidgeRegression.java
        RidgeRegression.java
        RidgeRegressionCache.java
        ValidationRidgeRegression.java
        WeakLeastAngle.java
        multiclass
        MultiClassOneVsRest.java
        gradfac
        FMCBoosting.java
        GradFacBootstrapMulticlass.java
        GradFacFilterMulticlass.java
        GradFacMulticlass.java
        GradFacSvdNMulticlass.java
        MultiClassColumnBootstrapOptimization.java
        hierarchical
        HierarchicalClassification.java
        HierarchicalRefinedClassification.java
        spoc
        AbstractCodingMatrixLearning.java
        CMLHelper.java
        CMLMetricOptimization.java
        ECOCCombo.java
        SPOCMethodClassic.java
        SPOCMethodProbsDecoder.java
        impl
        CodingMatrixLearning.java
        CodingMatrixLearningGreedy.java
        CodingMatrixLearningGreedyParallels.java
        multilabel
        MultiLabelConflictMulticlass.java
        MultiLabelSubsetsMulticlass.java
        rvm
        RVM.java
        RVMCache.java
        trees
        BFOptimizationSubset.java
        GreedyContinuesObliviousSoftBondariesRegressionTree.java
        GreedyExponentialObliviousTree.java
        GreedyLeastAngleObliviousTrees.java
        GreedyObliviousTree.java
        GreedyObliviousTreeValidationRidgeLeaves.java
        GreedyObliviousTreeWithVecOptimizationLeaves.java
        GreedyObliviousTreeWithWeakLearner.java
        LassoGreedyObliviousTree.java
        MutedFeatureObliviousTreeEnsemble.java
        RidgeGreedyObliviousTree.java
        wrappers
        MultiLabelWrapper.java
        MultiMethodOptimization.java
        models
        BumpyRegion.java
        CNF.java
        CherryRegion.java
        ContinousObliviousTree.java
        ExponentialObliviousTree.java
        FMModel.java
        LinearRegion.java
        ModelTools.java
        MultiClassModel.java
        ObliviousMultiClassTree.java
        ObliviousTree.java
        PolynomialExponentRegion.java
        QuadraticModel.java
        Region.java
        RegionBase.java
        ShifftedTrans.java
        TransObliviousTree.java
        gpf
        AttractivenessModel.java
        ClickProbabilityModel.java
        GPFGbrtModel.java
        GPFGbrtOptimization.java
        GPFLinearModel.java
        GPFLinearOptimization.java
        GPFModel.java
        Session.java
        Tensor3.java
        Tensor4.java
        weblogmodel
        BlockV1.java
        SessionV1AttractivenessModel.java
        WebLogV1ClickProbabilityModel.java
        WebLogV1GPFSession.java
        multiclass
        HierarchicalModel.java
        JoinedBinClassModel.java
        JoinedProbsModel.java
        MCModel.java
        MultiClass2BinaryModel.java
        MulticlassCodingMatrixModel.java
        MulticlassCodingMatrixModelProbsDecoder.java
        multilabel
        ConflictThresholdMultiLabelModel.java
        MultiLabelBinarizedModel.java
        MultiLabelModel.java
        MultiLabelSubsetsModel.java
        ThresholdProbsMultiLabelModel.java
        nn
        LayeredNetwork.java
        NeuralSpider.java
        nfa
        InputNode.java
        NFANetwork.java
        NFATopology.java
        NonDeterminedNode.java
        OutputNode.java
        WeightsCalculator.java
        pgm
        CompositePGM.java
        ProbabilisticGraphicalModel.java
        Route.java
        SimplePGM.java
        optimization
        FuncConvex.java
        Optimize.java
        PDQuadraticFunction.java
        StochasticGradientDescent.java
        TensorNetFunction.java
        impl
        FlexStepDescent.java
        GradientDescent.java
        MagicDescent.java
        Nesterov1.java
        Nesterov2.java
        tools
        QuadrFormTransformer.java
      - test
        java
        com
        spbsu
        ml
        BlockwiseTest.java
        DataToolsTest.java
        GridTest.java
        HierToolsTests.java
        MethodsTests.java
        ModelsTest.java
        NNTest.java
        OptimizersTest.java
        ScorePrinter.java
        SerializationTest.java
        TwoStepBlenderLearning.java
        cli
        cv
        FoldsEnumeratorTest.java
        cuda
        Charts.java
        JCublasHelperTest.java
        JCudaMemoryTest.java
        JCurandHelperTest.java
        data
        impl
        FloatMatrixTest.java
        FloatVectorTest.java
        root
        array
        VectorScaleTest.java
        nn
        DropoutTest.java
        data
        tools
        MCToolsTest.java
        methods
        rvm
        RVMTest.java
        models
        gpf
        GPFGbrtTest.java
        GPFLinearTest.java
        optimization
        TensorNetFuncTest.java
        testUtils
        TestResourceLoader.java
    - tests
      - src
        com
        spbsu
        ml
        ModelsTest.java
        PGMEMTest.java

package com.spbsu.bernulli.betaBinomialMixture;

import com.spbsu.bernulli.EM;
import com.spbsu.bernulli.caches.BetaCache;
import com.spbsu.bernulli.caches.Digamma1Cache;
import com.spbsu.bernulli.caches.DigammaCache;
import com.spbsu.commons.math.vectors.Mx;
import com.spbsu.commons.math.vectors.impl.mx.VecBasedMx;
import com.spbsu.commons.random.FastRandom;

import java.util.Arrays;

import static java.lang.Double.isNaN;


//reparametrezation of beta-distribution for solve singularities
// alpha + beta <= MaxN — maximim number of "prior" observations
//reparametrization of beta — \mu \in [0,1] and N.
//optimizaion — EM for mixture, after E — newton with alternating mu and N, shrinking N on maxN
public class RegularizedBetaBinomialMixtureEM extends EM<BetaBinomialMixture> {
  final int k;
  final int[] sums;
  final int n;
  final Mx dummy;
  final BetaBinomialMixture model;
  final FastRandom random;
  final SpecialFunctionCache funcs[];
  final MeanOptimization mean;
  final PrecisionOptimization precision;
  final int N; //it's regularized — maximum number of pseudo-observations

  final double mu[];
  final double precisions[];


  public RegularizedBetaBinomialMixtureEM(int k, final int[] sums, final int n, final int N, FastRandom random) {
    this.k = k; //components count
    this.sums = sums;
    this.n = n;
    this.dummy = new VecBasedMx(sums.length, k);
    this.model = new BetaBinomialMixture(k, n, random);
    this.random = random;
    this.funcs = new SpecialFunctionCache[k];
    this.mu = new double[k];
    this.precisions = new double[k];
    for (int i = 0; i < k; ++i) {
      precisions[i] = (this.model.alphas[i] + this.model.betas[i]);
      mu[i] = this.model.alphas[i] / precisions[i];
      precisions[i] = Math.min(precisions[i], N);
      this.funcs[i] = new SpecialFunctionCache(mu[i], precisions[i], n);
    }
    updateModel();
    this.N = N;
    this.mean = new MeanOptimization();
    precision = new PrecisionOptimization(N);
  }


  private void updateCache() {
    for (int i = 0; i < k; ++i) {
      funcs[i].update(model.alphas[i], model.betas[i]);
    }
  }


  @Override
  protected void expectation() {
    double[] probs = new double[k];
    updateCache();
    for (int i = 0; i < sums.length; ++i) {
      final int m = sums[i];
      double denum = 0;
      for (int j = 0; j < k; ++j) {
        probs[j] = model.q[j] * funcs[j].calculate(m, n);
        denum += probs[j];
      }
      for (int j = 0; j < k; ++j) {
        dummy.set(i, j, probs[j] /= denum);
      }
    }
  }

  private final int newtonIters = 3;
  private final double gradientStep = 0.05;
  private final double newtonStep = 0.01;
  private final int gradientIters = 20;

  private final int iterations = 3;
  boolean first = true;

  @Override
  protected void maximization() {
    final double probs[] = new double[k];
    for (int i = 0; i < sums.length; ++i) {
      for (int j = 0; j < k; ++j) {
        probs[j] += dummy.get(i, j);
      }
    }
    double total = 0;
    for (int i = 0; i < k; ++i) {
      total += probs[i];
    }
    for (int i = 0; i < k; ++i)
      model.q[i] = probs[i] / total;

    for (int i = 0; i < iterations; ++i) {
      mean.maximize();
      precision.maximize();
    }
  }


  int count = 300;
  double oldLikelihood = Double.NEGATIVE_INFINITY;

  @Override
  protected boolean stop() {
    final double currentLL = likelihood();
    if (Math.abs(oldLikelihood - currentLL) < 1e-1) {
      return true;
    }
    oldLikelihood = currentLL;
    return --count < 0;
  }

  @Override
  public BetaBinomialMixture model() {
    return model;
  }

  @Override
  protected double likelihood() {
    updateCache();
    double ll = 0;
    for (int i = 0; i < sums.length; ++i) {
      double p = 0;
      final int m = sums[i];
      for (int j = 0; j < model.alphas.length; ++j) {
        p += model.q[j] * funcs[j].calculate(m, n);
      }
      ll += Math.log(p);
    }

    return ll;
  }


  //emperical bayes estimation with fitted beta-mixture
  public double[] estimate(boolean fit) {
    if (fit) {
      fit();
    }
    expectation();
    double result[] = new double[sums.length];
    for (int i = 0; i < sums.length; ++i) {
      for (int j = 0; j < k; ++j)
        result[i] += dummy.get(i, j) * (sums[i] + model.alphas[j]) * 1.0 / (n + model.betas[j] + model.alphas[j]);
    }
    return result;
  }


  class MeanOptimization {
    final double gradientCache[];
    final double newtonCache[];

    MeanOptimization() {
      this.gradientCache = new double[2 * model.alphas.length];
      this.newtonCache = new double[3 * model.alphas.length];
    }

    private boolean newtonStep(double step) {
      updateCache();
      Arrays.fill(newtonCache, 0.0);
      fillGradient();

      final double cache[] = new double[k];
      final double cache2[] = new double[k];
      for (int i = 0; i < k; ++i) {
        final double beta = model.betas[i];
        final double alpha = model.alphas[i];
        cache[i] = -2 * (funcs[i].digamma(Type.Alpha, 0) - funcs[i].digamma(Type.Beta, 0));
        cache[i] += beta * (funcs[i].digamma1(Type.Alpha, 0) + funcs[i].digamma1(Type.Beta, 0));

        cache2[i] = alpha * beta * (funcs[i].digamma1(Type.Alpha, 0) + funcs[i].digamma1(Type.Beta, 0));
        cache2[i] += (beta - alpha) * (funcs[i].digamma(Type.Alpha, 0) - funcs[i].digamma(Type.Beta, 0));
      }
      for (int i = 0; i < sums.length; ++i) {
        final int m = sums[i];
        for (int j = 0; j < k; ++j) {
          final SpecialFunctionCache func = funcs[j];
          final double prob = dummy.get(i, j);
          final double alpha = model.alphas[j];
          final double beta = model.betas[j];


          final int idx0 = 3 * j; //a
          final int idx1 = 3 * j + 1;//b
          final int idx2 = 3 * j + 2;//d

          final double dpp;
          final double dqq;
          {
            final double tmp1 = -2 * func.digamma(Type.Beta, n - m) - beta * func.digamma1(Type.Beta, n - m);
            final double tmp2 = 2 * func.digamma(Type.Alpha, m) - beta * func.digamma1(Type.Alpha, m);
            final double tmp = prob * (tmp1 + tmp2 + cache[j]);

            dpp = -beta * tmp;
            dqq = alpha * tmp;
          }

          final double dpq;
          {
            final double tmp1 = (beta - alpha) * (func.digamma(Type.Beta, n - m) - func.digamma(Type.Alpha, m));
            final double tmp2 = -(alpha * beta) * (func.digamma1(Type.Beta, n - m) + func.digamma1(Type.Alpha, m));
            final double tmp = prob * (tmp1 + tmp2 + cache2[j]);
            dpq = tmp;
          }

          newtonCache[idx0] += dpp;
          newtonCache[idx1] += dpq;
          newtonCache[idx2] += dqq;
        }
      }

      for (int i = 0; i < k; ++i) {
        //gradient
        final double dp = gradientCache[2 * i];
        final double dq = gradientCache[2 * i + 1];
        //hessian
        final double a = newtonCache[3 * i];
        final double b = newtonCache[3 * i + 1];
        final double d = newtonCache[3 * i + 2];
        final double det = a * d - b * b;

        final double dirp = (d * dp - b * dq) / det;
        final double dirq = (a * dq - b * dp) / det;


        while (mu[i] - step * dirp < 1e-3 || 1 - mu[i] - step * dirq < 1e-3) {
          step *= step;
          if (step < 1e-15)
            return true;
        }

        double p = mu[i] - step * dirp;
        double q = 1 - mu[i] - step * dirq;
        p /= (p + q);
        mu[i] = p;
      }
      updateModel();
      return false;
    }

    //don't use it before update
    private void fillGradient() {
      Arrays.fill(gradientCache, 0.0);
      final double cache[] = new double[k];
      for (int i = 0; i < k; ++i) {
        cache[i] = funcs[i].digamma(Type.Alpha, 0) - funcs[i].digamma(Type.Beta, 0);
      }
      for (int i = 0; i < sums.length; ++i) {
        final int m = sums[i];
        for (int j = 0; j < k; ++j) {
          final double p = dummy.get(i, j);
          final double tmp = p * (cache[j] - funcs[j].digamma(Type.Alpha, m) + funcs[j].digamma(Type.Beta, n - m));
          final double grad1 = -model.betas[j] * tmp / precisions[j];
          final double grad2 = model.alphas[j] * tmp / precisions[j];
          gradientCache[2 * j] += grad1;
          gradientCache[2 * j + 1] += grad2;
        }
      }
    }

    private boolean gradientStep(double step) {
      updateCache();
      fillGradient();
      for (int i = 0; i < gradientCache.length; ++i) {
        if (isNaN(gradientCache[i])) {
          return true;
        }
      }
      for (int i = 0; i < k; ++i) {
        final double alpha = model.alphas[i];
        final double dalpha = gradientCache[2 * i];
        final double beta = model.betas[i];
        final double dbeta = gradientCache[2 * i + 1];
        while (alpha + step * dalpha < 1e-3 || beta + step * dbeta < 1e-3) {
          step *= step;
          if (step < 1e-15)
            return true;
        }
        final double newAlpha = alpha + step * dalpha;
        final double newBeta = beta + step * dbeta;
        mu[i] = newAlpha / (newAlpha + newBeta);
      }
      updateModel();
      return false;
    }

    boolean first = true;

    boolean maximize() {
//      if (first) {
      for (int i = 0; i < gradientIters; ++i)
        gradientStep(gradientStep);
//        first = false;
//      }
//      for (int i = 0; i < newtonIters; ++i)
//        newtonStep(newtonStep);
      return true;
    }
  }


  class PrecisionOptimization {
    final double gradientCache[];
    final double newtonCache[];
    final int maxPrecision;
    boolean[] stopped;
    int stoppedCount;

    PrecisionOptimization(int N) {
      this.gradientCache = new double[model.alphas.length];
      this.maxPrecision = N;
      this.newtonCache = new double[model.alphas.length];
      this.stopped = new boolean[model.alphas.length];
      stoppedCount = 0;
    }

    private boolean newtonStep(double step) {
      updateCache();
      Arrays.fill(newtonCache, 0.0);
      fillGradient();

      final double cache[] = new double[k];
      for (int i = 0; i < k; ++i) {
        if (stopped[i])
          continue;
        final double p = mu[i];
        cache[i] = -p * p * funcs[i].digamma1(Type.Alpha, 0) - (1 - p) * (1 - p) * funcs[i].digamma1(Type.Beta, 0);
        cache[i] += -funcs[i].digamma1(Type.AlphaBeta, n) + funcs[i].digamma1(Type.AlphaBeta, 0);
      }
      for (int i = 0; i < sums.length; ++i) {
        final int m = sums[i];
        for (int j = 0; j < k; ++j) {
          if (stopped[j])
            continue;
          final double prob = dummy.get(i, j);
          final double p = mu[j];
          final double dgrad = prob * (cache[j] + (1 - p) * (1 - p) * funcs[j].digamma1(Type.Beta, n - m) + p * p * funcs[j].digamma1(Type.Alpha, m));
          newtonCache[j] += dgrad;
        }
      }

      for (int i = 0; i < k; ++i) {
        if (stopped[i])
          continue;
        //matrix
        double N = precisions[i] - step * (gradientCache[i] / newtonCache[i]);
        if (N > 0) {
          if (precisions[i] > maxPrecision) {
            precisions[i] = maxPrecision;
            stopped[i] = true;
            stoppedCount++;
          } else {
            precisions[i] = N;
          }
        }
      }
      updateModel();
      return false;
    }

    //don't use it before update()
    private void fillGradient() {
      Arrays.fill(gradientCache, 0.0);
      final double cache[] = new double[k];
      for (int i = 0; i < k; ++i) {
        if (stopped[i])
          continue;
        cache[i] = -mu[i] * funcs[i].digamma(Type.Alpha, 0) - (1 - mu[i]) * funcs[i].digamma(Type.Beta, 0)
                + funcs[i].digamma(Type.AlphaBeta, 0) - funcs[i].digamma(Type.AlphaBeta, n);
      }
      for (int i = 0; i < sums.length; ++i) {
        final int m = sums[i];
        for (int j = 0; j < k; ++j) {
          if (stopped[j])
            continue;
          final double prob = dummy.get(i, j);
          final double p = mu[j];
          final SpecialFunctionCache func = funcs[j];
          final double grad = (1 - p) * func.digamma(Type.Beta, n - m) + p * func.digamma(Type.Alpha, m) + cache[j];
          gradientCache[j] += prob * grad;
        }
      }
    }

    private boolean gradientStep(double step) {
      updateCache();
      fillGradient();
      for (int i = 0; i < gradientCache.length; ++i) {
        if (isNaN(gradientCache[i])) {
          return true;
        }
      }
      for (int i = 0; i < k; ++i) {
        if (stopped[i])
          continue;
        while (precisions[i] + step * gradientCache[i] < 1e-3) {
          step *= 0.5;
          if (step < 1e-10)
            return false;
        }
        precisions[i] += step * gradientCache[i];
        if (precisions[i] > maxPrecision) {
          precisions[i] = maxPrecision;
          stopped[i] = true;
          stoppedCount++;
        }

      }
      updateModel();
      return false;
    }

    boolean first = true;

    boolean maximize() {
      if (stoppedCount == k)
        return false;
      if (first) {
        for (int i = 0; i < gradientIters; ++i)
          gradientStep(gradientStep);
        first = false;
      }

      for (int i = 0; i < 3; ++i)
        gradientStep(0.01);

      for (int i = 0; i < newtonIters; ++i)
        newtonStep(newtonStep);
      return true;
//    }
    }
  }

  private void updateModel() {
    for (int i = 0; i < model.alphas.length; ++i) {
      model.alphas[i] = mu[i] * precisions[i];
      model.betas[i] = (1 - mu[i]) * precisions[i];
    }
  }

  private enum Type {
    Alpha,
    Beta,
    AlphaBeta
  }

  private double alpha(double mu, double N) {
    return mu * N;
  }

  private double beta(double mu, double N) {
    return (1 - mu) * N;
  }

  private class SpecialFunctionCache {
    DigammaCache head;
    DigammaCache tail;
    DigammaCache alphabeta;
    Digamma1Cache dalphabeta;
    Digamma1Cache dhead;
    Digamma1Cache dtail;
    BetaCache betaCache;


    public SpecialFunctionCache(double mu, double N, int n) {
      betaCache = new BetaCache(alpha(mu, N), beta(mu, N), n);
      head = new DigammaCache(mu * N, n);
      tail = new DigammaCache((1 - mu) * N, n);
      dhead = new Digamma1Cache(mu * N, n);
      dtail = new Digamma1Cache((1 - mu) * N, n);
      dalphabeta = new Digamma1Cache(N, n);
      alphabeta = new DigammaCache(N, n);
    }


    public double calculate(int m, int n) {
      return betaCache.calculate(m, n);
    }


    final public double digamma(Type type, int offset) {
      if (type == Type.Alpha) {
        return head.calculate(offset);
      } else if (type == Type.Beta) {
        return tail.calculate(offset);
      }

      return alphabeta.calculate(offset);
    }

    public double digamma1(Type type, int offset) {
      if (type == Type.Alpha) {
        return dhead.calculate(offset);
      } else if (type == Type.Beta) {
        return dtail.calculate(offset);
      }
      return dalphabeta.calculate(offset);
    }


    final public void update(final double alpha, final double beta) {
      betaCache.update(alpha, beta);
      head.update(alpha);
      tail.update(beta);
      dhead.update(alpha);
      dtail.update(beta);
      dalphabeta.update(alpha + beta);
      alphabeta.update(alpha + beta);
    }
  }
}