DiskBackedStore.java example

Explorer

motherbrain-master
- src
  - com
    - zillabyte
      - motherbrain
        api
        APIException.java
        APIService.java
        LocalAPIService.java
        RelationsHelper.java
        RestAPIHelper.java
        benchmarking
        Benchmark.java
        BenchmarkFactory.java
        GraphiteBenchmarker.java
        MovingBenchmarker.java
        NoopBenchmarker.java
        StderrBenchmarker.java
        container
        Container.java
        ContainerCacher.java
        ContainerEnvironmentHelper.java
        ContainerException.java
        ContainerExecuteBuilder.java
        ContainerFactory.java
        ContainerPathHelper.java
        ContainerSerializer.java
        ContainerWrapper.java
        NoopRemoteContainerCleaner.java
        PipeGateway.java
        RemoteContainerCleaner.java
        TcpSocketHelper.java
        UnixSocketHelper.java
        local
        InplaceContainer.java
        InplaceContainerFactory.java
        InplaceSerializer.java
        coordination
        AskHandler.java
        AskWrapper.java
        CoordinationException.java
        CoordinationService.java
        CoordinationServiceWrapper.java
        Lock.java
        MessageHandler.java
        RemoteCoordinationException.java
        Watcher.java
        mock
        MockStateService.java
        redis
        RedisException.java
        TransactionalMessageWrapper.java
        flow
        ActionTimeoutException.java
        App.java
        Component.java
        EndCyclePolicy.java
        Fields.java
        Flow.java
        FlowCompilationException.java
        FlowException.java
        FlowInstance.java
        FlowInstanceSetBuilder.java
        FlowInstanceWrapper.java
        FlowOperationInstance.java
        FlowOperationInstanceCollection.java
        FlowRecoveryException.java
        FlowService.java
        FlowState.java
        FlowStateCoordinator.java
        FlowStateException.java
        MapTuple.java
        StateMachine.java
        StateMachineException.java
        StateMachineHelper.java
        StreamBuilder.java
        aggregation
        AggregationException.java
        AggregationKey.java
        AggregationStore.java
        AggregationStoreFactory.java
        AggregationStoreWrapper.java
        Aggregator.java
        CachedStore.java
        CachedStoreFactory.java
        DefaultAggregationStoreFactory.java
        DiskBackedStore.java
        FlowAggregationSplitter.java
        MemoryStore.java
        MemoryStoreFactory.java
        PartialAggregator.java
        StoreType.java
        TuplePage.java
        buffer
        BufferClientFactory.java
        BufferConsumer.java
        BufferFlusher.java
        BufferProducer.java
        BufferService.java
        SinkToBuffer.java
        SourceFromBuffer.java
        mock
        LocalBufferClientFactory.java
        LocalBufferConsumer.java
        LocalBufferProducer.java
        LocalDevBufferClientFactory.java
        LocalDevBufferFlusher.java
        LocalDevBufferProducer.java
        MockBufferProducer.java
        MockBufferService.java
        collectors
        OutputCollector.java
        coordinated
        AckTuple.java
        BaseCoordTuple.java
        BatchCompleteAckTuple.java
        BatchCompleteTuple.java
        BatchState.java
        BatchTracker.java
        BatchedTuple.java
        CoordTupleOptions.java
        CoordinatedOutputCollector.java
        DeadNodeDetectedException.java
        ExplicitAckRequestTuple.java
        MaxIterationsExceededException.java
        ObserveIncomingTupleAction.java
        PingTuple.java
        PongTuple.java
        QueuedTuple.java
        support
        CoordinatedOutputCollectorSupportFactory.java
        EmptyTupleIdSet.java
        FailedTupleHandler.java
        TupleIdGenerator.java
        TupleIdMapper.java
        TupleIdSet.java
        naive
        DoNothingFailedTupleHandler.java
        NaiveCoordinatedOutputCollectorSupportFactory.java
        SerialTupleIdGenerator.java
        UncompressedTupleIdMapper.java
        UncompressedTupleIdSet.java
        components
        ComponentInput.java
        ComponentOutput.java
        builtin
        BuiltinComponents.java
        FetchUrlComponent.java
        config
        FlowConfig.java
        OperationConfig.java
        UserConfig.java
        error
        strategies
        ErrorStrategyFactory.java
        ErrorThresholdExceededException.java
        FakeLocalException.java
        FlowErrorStrategy.java
        ForgivingFlowErrorStrategy.java
        OperationErrorStrategy.java
        PassiveWorkerPercentageAndAbsoluteOperationErrorStrategy.java
        StrictFlowErrorStrategy.java
        WorkerThrowsErrorPercentageAndAbsoluteOperationErrorStrategy.java
        graph
        Connection.java
        FlowGraph.java
        heartbeats
        Heartbeat.java
        HeartbeatException.java
        local
        LocalFlowController.java
        LocalFlowOutputCollector.java
        LocalFlowService.java
        LocalOperationSlot.java
        operations
        AggregationOperation.java
        AggregationState.java
        Function.java
        FunctionState.java
        GroupBy.java
        Join.java
        JoinType.java
        MockOperationLogger.java
        Operation.java
        OperationDeadException.java
        OperationException.java
        OperationLogger.java
        OperationLoggerException.java
        OperationMessage.java
        OperationSleeper.java
        ProcessableOperation.java
        Sink.java
        SinkState.java
        Source.java
        SourceState.java
        builtin
        Clumper.java
        Count.java
        RateLimiter.java
        Unique.java
        decorators
        EmitDecorator.java
        RemoveFields.java
        RenameFields.java
        RetainFields.java
        multilang
        MultiLangCleaner.java
        MultiLangErrorHandler.java
        MultiLangException.java
        MultiLangLogHandler.java
        MultiLangMessageHandler.java
        MultiLangProcess.java
        MultiLangProcessDiedUnexpectedlyException.java
        MultiLangProcessException.java
        MultiLangProcessGeneralOperationObserver.java
        MultiLangProcessStartupLogObserver.java
        MultiLangProcessTupleObserver.java
        builder
        APIFlowBuilder.java
        APIFlowBuilderFactory.java
        FlowBuilderFactory.java
        FlowFetcher.java
        FlowValidator.java
        InplaceFlowBuilder.java
        InplaceFlowBuilderFactory.java
        MultilangFlowCompiler.java
        PlaceHolderOperation.java
        RouteBy.java
        operations
        LocalComponent.java
        MultiLangAggregator.java
        MultiLangOperation.java
        MultiLangRunEach.java
        MultiLangRunSource.java
        MultilangClumper.java
        MultilangHandler.java
        rpc
        RPCHelper.java
        RPCRequest.java
        RPCResponse.java
        RPCSink.java
        RPCSource.java
        queues
        InputQueue.java
        MockQueueFactory.java
        OutputQueue.java
        QueueFactory.java
        sourcefromrelation
        ShardReader.java
        ShardType.java
        tests
        helpers
        MockInstanceHelper.java
        metrics
        Metrics.java
        MockMetrics.java
        reactor
        lightweight
        ProcessTimeoutException.java
        relational
        APIRelationDefFactory.java
        AliasedQuery.java
        BufferQuery.java
        ColumnDef.java
        DataType.java
        DefaultStreamException.java
        MissingFieldException.java
        Query.java
        RelationBackend.java
        RelationDef.java
        RelationDefFactory.java
        RelationException.java
        S3OnlyQuery.java
        StreamMarker.java
        StreamReader.java
        UnexpectedFieldException.java
        naivepostgresimpl
        NaivePostgresStreamMarker.java
        redshiftimpl
        RedshiftStreamMarker.java
        RedshiftStreamReader.java
        shell
        LocalOsxShellFactory.java
        MachineType.java
        ShellFactory.java
        UbuntuEc2ShellFactory.java
        UbuntuTeamCityShellFactory.java
        UbuntuVagrantShellFactory.java
        state
        package-info.java
        top
        BasicTopService.java
        CommandLine.java
        LocalCommandLineHelper.java
        LocalServiceMain.java
        MotherbrainException.java
        MotherbrainRuntimeException.java
        TopService.java
        universe
        Config.java
        Environment.java
        ExceptionHandler.java
        ExpectedConfigNotPresent.java
        FileFactory.java
        FileFactoryException.java
        LocalUniverseBuilder.java
        LoggerFactory.java
        MockConfig.java
        S3Exception.java
        SSHException.java
        SSHFactory.java
        Universe.java
        UniverseBuilder.java
        utils
        ByteArrayWrapper.java
        CompressUtils.java
        DateHelper.java
        ExceptionAttempt.java
        FileLockUtil.java
        Glob.java
        JSONUtil.java
        JarCompilationException.java
        Log4jWrapper.java
        MapBuilder.java
        MeteredLog.java
        SerializableMonitor.java
        UrlHelper.java
        Utils.java
        VersionComparer.java
        backoff
        BackoffTicker.java
        ExponentialBackoffTicker.java
        csv
        Assertions.java
        CSVFormat.java
        CSVParser.java
        CSVPrinter.java
        CSVRecord.java
        Constants.java
        ExtendedBufferedReader.java
        Lexer.java
        Quote.java
        Token.java
        package-info.java
        dfs
        DFSService.java
        DFSServiceWrapper.java
        LocalDFSService.java
        queue
        ByteSizable.java

package com.zillabyte.motherbrain.flow.aggregation;

import java.io.File;
import java.io.IOException;
import java.util.Iterator;
import java.util.Stack;

import org.apache.commons.codec.digest.DigestUtils;
import org.apache.log4j.Logger;
import org.codehaus.plexus.util.FileUtils;

import com.google.common.base.Throwables;
import com.google.common.io.Files;
import com.zillabyte.motherbrain.flow.MapTuple;
import com.zillabyte.motherbrain.flow.operations.AggregationOperation;
import com.zillabyte.motherbrain.universe.Universe;
import com.zillabyte.motherbrain.utils.Utils;


/***
 *  Production Aggregate Store
 *  @author sjarvie
 */
public class DiskBackedStore implements AggregationStore {

  private static final long serialVersionUID = -1837276500478667648L;
  private AggregationOperation _operation;
  private String _extraPrefix;
  private static Logger _log = Utils.getLogger(DiskBackedStore.class);


  /***
   * 
   * @param o
   */
  public DiskBackedStore(AggregationOperation o) {
    this(o, "");
  }

  /***
   * 
   * @param o
   * @param extraPrefix
   */
  public DiskBackedStore(AggregationOperation o, String extraPrefix) {
    _operation = o;
    _extraPrefix = extraPrefix;

    // Make sure the target is clear... 
    File root = new File(rootPath());
    if (root.exists()) {
      _log.warn("aggregation root already exists: " + root + " ... deleting ");
      try {
        FileUtils.deleteDirectory(root);
      } catch (IOException e) {
        Throwables.propagate(e);
      }
    }
  }


  /***
   * 
   * @return
   */
  public String rootPath() {
    String root = Universe.instance().fileFactory().getTmp().toString();
    String flowId = _operation.topFlowId();
    String instanceName = _operation.instanceName();
    String extraPrefix = (_extraPrefix.equals("") ? "/" : _extraPrefix + "/");
    return root + "/f" + flowId + "/" + instanceName + "/aggregate_tuples/" + extraPrefix;
  }


  /**
   * @return the location of the tuple aggregate keys and values
   */
  public String dataPath(Object batchId){
    return rootPath() + batchId ;
  }


  /**
   * Version 1
   * Traverses to locate a key's directory
   * @return t
   */
  public String keyPath(Object batchId, AggregationKey key) {
    String md5 = DigestUtils.md5Hex(Utils.serialize(key));
    return dataPath(batchId) + "/" + md5;
  }


  @Override
  public void addToGroup(Object batchId, AggregationKey key, MapTuple tuple) {


    // add key if necessary
    String path = keyPath(batchId, key);

    try {
      File keyFile = new File(path + "/key.txt");
      if (!keyFile.exists()) {
        Files.createParentDirs(keyFile);
        Files.touch(keyFile);
        Files.write(Utils.serialize(key), keyFile);
      }

      TuplePage page = new TuplePage(path);
      page.insert(tuple);

    } catch (IOException e) {
      e.printStackTrace();
    }
  }


  @Override
  public boolean hasGroup(Object batch, AggregationKey key) {
    File f = new File(keyPath(batch, key));
    return f.exists() && f.isDirectory() && (f.listFiles() != null);
    // return _map.containsKey(key);
  }


  @Override
  public Iterator<MapTuple> getGroupIterator(Object batch, AggregationKey key) {
    // return a custom Iterator that incrementally reads the next tuples
    TuplePage page = new TuplePage(keyPath(batch, key));
    return page.iterator();
  }


  @Override
  public void deleteGroup(Object batch, AggregationKey key) {
    File keyDir = new File(keyPath(batch, key));
    if (keyDir.exists()) {
      for (File f : keyDir.listFiles()){
        f.delete();
      }
      keyDir.delete();
    }
  }


  @Override
  public Iterator<AggregationKey> keyIterator(final Object batch) throws AggregationException {



    Iterator<AggregationKey> it = new Iterator<AggregationKey>() {

      private AggregationKey _currentKey = null;

      // Use DFS to locate key files
      private Stack<File> _stack = null;
      private String root = dataPath(batch);


      @Override
      public boolean hasNext() {

        // Initialize the DFS
        if (_stack == null) {
          _stack = new Stack<File>();
          File rootDir = new File(root);
          _stack.add(rootDir);
        }

        if (_currentKey != null){
          return true;
        }

        if (_stack.empty()){
          return false;
        } else {

          // Find a valid key if it exists
          while (_stack.empty()){
            File dir = _stack.pop();

            if (dir.exists() && dir.isDirectory()) {
              for (File f : dir.listFiles()){
                if (f.isFile() && f.getName().equals("key.txt")){
                  try {
                    AggregationKey key = (AggregationKey) Utils.deserialize(Files.toByteArray(f));
                    _currentKey = key;
                    return true;
                  } catch (IOException e) {
                    return false;
                  }
                } else if (f.isDirectory()){
                  _stack.add(f);
                }
              } 
            }
          }

        }
        return false;
      }

      @Override
      public AggregationKey next() {
        if (!hasNext()){
          return null;
        }

        AggregationKey key = _currentKey;
        _currentKey = null;        
        return key;
      }

      @Override
      public void remove() {}
    };
    return it;
  }


  @Override
  public void flush(Object batch) {    
  }


  @Override
  public void deleteBatch(Object batch) throws AggregationException {
    try {
      FileUtils.deleteDirectory(new File(dataPath(batch)));
    } catch (IOException e) {
      throw (AggregationException) new AggregationException(e).setUserMessage("Unable to cleanup aggregation data.").adviseRetry();
    }
  }

}