FlowStateCoordinator.java example

Explorer

motherbrain-master
- src
  - com
    - zillabyte
      - motherbrain
        api
        APIException.java
        APIService.java
        LocalAPIService.java
        RelationsHelper.java
        RestAPIHelper.java
        benchmarking
        Benchmark.java
        BenchmarkFactory.java
        GraphiteBenchmarker.java
        MovingBenchmarker.java
        NoopBenchmarker.java
        StderrBenchmarker.java
        container
        Container.java
        ContainerCacher.java
        ContainerEnvironmentHelper.java
        ContainerException.java
        ContainerExecuteBuilder.java
        ContainerFactory.java
        ContainerPathHelper.java
        ContainerSerializer.java
        ContainerWrapper.java
        NoopRemoteContainerCleaner.java
        PipeGateway.java
        RemoteContainerCleaner.java
        TcpSocketHelper.java
        UnixSocketHelper.java
        local
        InplaceContainer.java
        InplaceContainerFactory.java
        InplaceSerializer.java
        coordination
        AskHandler.java
        AskWrapper.java
        CoordinationException.java
        CoordinationService.java
        CoordinationServiceWrapper.java
        Lock.java
        MessageHandler.java
        RemoteCoordinationException.java
        Watcher.java
        mock
        MockStateService.java
        redis
        RedisException.java
        TransactionalMessageWrapper.java
        flow
        ActionTimeoutException.java
        App.java
        Component.java
        EndCyclePolicy.java
        Fields.java
        Flow.java
        FlowCompilationException.java
        FlowException.java
        FlowInstance.java
        FlowInstanceSetBuilder.java
        FlowInstanceWrapper.java
        FlowOperationInstance.java
        FlowOperationInstanceCollection.java
        FlowRecoveryException.java
        FlowService.java
        FlowState.java
        FlowStateCoordinator.java
        FlowStateException.java
        MapTuple.java
        StateMachine.java
        StateMachineException.java
        StateMachineHelper.java
        StreamBuilder.java
        aggregation
        AggregationException.java
        AggregationKey.java
        AggregationStore.java
        AggregationStoreFactory.java
        AggregationStoreWrapper.java
        Aggregator.java
        CachedStore.java
        CachedStoreFactory.java
        DefaultAggregationStoreFactory.java
        DiskBackedStore.java
        FlowAggregationSplitter.java
        MemoryStore.java
        MemoryStoreFactory.java
        PartialAggregator.java
        StoreType.java
        TuplePage.java
        buffer
        BufferClientFactory.java
        BufferConsumer.java
        BufferFlusher.java
        BufferProducer.java
        BufferService.java
        SinkToBuffer.java
        SourceFromBuffer.java
        mock
        LocalBufferClientFactory.java
        LocalBufferConsumer.java
        LocalBufferProducer.java
        LocalDevBufferClientFactory.java
        LocalDevBufferFlusher.java
        LocalDevBufferProducer.java
        MockBufferProducer.java
        MockBufferService.java
        collectors
        OutputCollector.java
        coordinated
        AckTuple.java
        BaseCoordTuple.java
        BatchCompleteAckTuple.java
        BatchCompleteTuple.java
        BatchState.java
        BatchTracker.java
        BatchedTuple.java
        CoordTupleOptions.java
        CoordinatedOutputCollector.java
        DeadNodeDetectedException.java
        ExplicitAckRequestTuple.java
        MaxIterationsExceededException.java
        ObserveIncomingTupleAction.java
        PingTuple.java
        PongTuple.java
        QueuedTuple.java
        support
        CoordinatedOutputCollectorSupportFactory.java
        EmptyTupleIdSet.java
        FailedTupleHandler.java
        TupleIdGenerator.java
        TupleIdMapper.java
        TupleIdSet.java
        naive
        DoNothingFailedTupleHandler.java
        NaiveCoordinatedOutputCollectorSupportFactory.java
        SerialTupleIdGenerator.java
        UncompressedTupleIdMapper.java
        UncompressedTupleIdSet.java
        components
        ComponentInput.java
        ComponentOutput.java
        builtin
        BuiltinComponents.java
        FetchUrlComponent.java
        config
        FlowConfig.java
        OperationConfig.java
        UserConfig.java
        error
        strategies
        ErrorStrategyFactory.java
        ErrorThresholdExceededException.java
        FakeLocalException.java
        FlowErrorStrategy.java
        ForgivingFlowErrorStrategy.java
        OperationErrorStrategy.java
        PassiveWorkerPercentageAndAbsoluteOperationErrorStrategy.java
        StrictFlowErrorStrategy.java
        WorkerThrowsErrorPercentageAndAbsoluteOperationErrorStrategy.java
        graph
        Connection.java
        FlowGraph.java
        heartbeats
        Heartbeat.java
        HeartbeatException.java
        local
        LocalFlowController.java
        LocalFlowOutputCollector.java
        LocalFlowService.java
        LocalOperationSlot.java
        operations
        AggregationOperation.java
        AggregationState.java
        Function.java
        FunctionState.java
        GroupBy.java
        Join.java
        JoinType.java
        MockOperationLogger.java
        Operation.java
        OperationDeadException.java
        OperationException.java
        OperationLogger.java
        OperationLoggerException.java
        OperationMessage.java
        OperationSleeper.java
        ProcessableOperation.java
        Sink.java
        SinkState.java
        Source.java
        SourceState.java
        builtin
        Clumper.java
        Count.java
        RateLimiter.java
        Unique.java
        decorators
        EmitDecorator.java
        RemoveFields.java
        RenameFields.java
        RetainFields.java
        multilang
        MultiLangCleaner.java
        MultiLangErrorHandler.java
        MultiLangException.java
        MultiLangLogHandler.java
        MultiLangMessageHandler.java
        MultiLangProcess.java
        MultiLangProcessDiedUnexpectedlyException.java
        MultiLangProcessException.java
        MultiLangProcessGeneralOperationObserver.java
        MultiLangProcessStartupLogObserver.java
        MultiLangProcessTupleObserver.java
        builder
        APIFlowBuilder.java
        APIFlowBuilderFactory.java
        FlowBuilderFactory.java
        FlowFetcher.java
        FlowValidator.java
        InplaceFlowBuilder.java
        InplaceFlowBuilderFactory.java
        MultilangFlowCompiler.java
        PlaceHolderOperation.java
        RouteBy.java
        operations
        LocalComponent.java
        MultiLangAggregator.java
        MultiLangOperation.java
        MultiLangRunEach.java
        MultiLangRunSource.java
        MultilangClumper.java
        MultilangHandler.java
        rpc
        RPCHelper.java
        RPCRequest.java
        RPCResponse.java
        RPCSink.java
        RPCSource.java
        queues
        InputQueue.java
        MockQueueFactory.java
        OutputQueue.java
        QueueFactory.java
        sourcefromrelation
        ShardReader.java
        ShardType.java
        tests
        helpers
        MockInstanceHelper.java
        metrics
        Metrics.java
        MockMetrics.java
        reactor
        lightweight
        ProcessTimeoutException.java
        relational
        APIRelationDefFactory.java
        AliasedQuery.java
        BufferQuery.java
        ColumnDef.java
        DataType.java
        DefaultStreamException.java
        MissingFieldException.java
        Query.java
        RelationBackend.java
        RelationDef.java
        RelationDefFactory.java
        RelationException.java
        S3OnlyQuery.java
        StreamMarker.java
        StreamReader.java
        UnexpectedFieldException.java
        naivepostgresimpl
        NaivePostgresStreamMarker.java
        redshiftimpl
        RedshiftStreamMarker.java
        RedshiftStreamReader.java
        shell
        LocalOsxShellFactory.java
        MachineType.java
        ShellFactory.java
        UbuntuEc2ShellFactory.java
        UbuntuTeamCityShellFactory.java
        UbuntuVagrantShellFactory.java
        state
        package-info.java
        top
        BasicTopService.java
        CommandLine.java
        LocalCommandLineHelper.java
        LocalServiceMain.java
        MotherbrainException.java
        MotherbrainRuntimeException.java
        TopService.java
        universe
        Config.java
        Environment.java
        ExceptionHandler.java
        ExpectedConfigNotPresent.java
        FileFactory.java
        FileFactoryException.java
        LocalUniverseBuilder.java
        LoggerFactory.java
        MockConfig.java
        S3Exception.java
        SSHException.java
        SSHFactory.java
        Universe.java
        UniverseBuilder.java
        utils
        ByteArrayWrapper.java
        CompressUtils.java
        DateHelper.java
        ExceptionAttempt.java
        FileLockUtil.java
        Glob.java
        JSONUtil.java
        JarCompilationException.java
        Log4jWrapper.java
        MapBuilder.java
        MeteredLog.java
        SerializableMonitor.java
        UrlHelper.java
        Utils.java
        VersionComparer.java
        backoff
        BackoffTicker.java
        ExponentialBackoffTicker.java
        csv
        Assertions.java
        CSVFormat.java
        CSVParser.java
        CSVPrinter.java
        CSVRecord.java
        Constants.java
        ExtendedBufferedReader.java
        Lexer.java
        Quote.java
        Token.java
        package-info.java
        dfs
        DFSService.java
        DFSServiceWrapper.java
        LocalDFSService.java
        queue
        ByteSizable.java

package com.zillabyte.motherbrain.flow;

import java.io.Serializable;

import org.apache.commons.lang.NotImplementedException;
import org.apache.log4j.Logger;

import com.zillabyte.motherbrain.coordination.CoordinationException;
import com.zillabyte.motherbrain.flow.error.strategies.FlowErrorStrategy;
import com.zillabyte.motherbrain.flow.operations.Operation;
import com.zillabyte.motherbrain.flow.operations.OperationException;
import com.zillabyte.motherbrain.universe.Universe;
import com.zillabyte.motherbrain.utils.Utils;

public class FlowStateCoordinator implements Serializable {
  
  /**
   * 
   */
  private static final long serialVersionUID = 8973237210512561403L;

  protected App _flow;
  protected FlowErrorStrategy _errorStrategy;
  
  static final Logger _log = Utils.getLogger(FlowStateCoordinator.class);
  
  public FlowStateCoordinator(App flow) {
    _flow = flow;
    _errorStrategy = Universe.instance().errorStrategyFactory().createFlowStrategy();
  }
  
  /***
   * Update the FlowState based on current state of other datums. e.g. this is called
   * anytime anything interesting happens that might make us change FlowState
   * @throws StateMachineException 
   * @throws FlowException 
   * @throws InterruptedException 
   * @throws OperationException 
   * @throws CoordinationException 
   */
  public FlowState maybeGetNewFlowState(final FlowInstanceSetBuilder builder, final FlowState currentState) throws StateMachineException, FlowException, InterruptedException, OperationException, CoordinationException {
    /*
     * Do we have any errors in our operations?
     */
    if (currentState != FlowState.ERROR && _errorStrategy.shouldTransitionToFlowError(builder)) {
      return FlowState.ERROR;
    }
    switch (currentState) {
    /*
     * We don't recover from death or ERRORs (the only way is to re-register).
     *
     * Similarly, INITIAL, STARTED and WAITING_FOR_NEXT_CYCLE require explicit
     * user requests before they may be transitioned from.
     */
    case RETIRING:
      // fall through
    case RETIRED:
      // fall through
    case ERRORING:
      // fall through
    case ERROR:
      // fall through
    case KILLING:
      // fall through
    case KILLED:
      // fall through
    case INITIAL:
      // fall through
    case PAUSED:
      // fall through
    case STARTED:
      // fall through
    case WAITING_FOR_NEXT_CYCLE:
      break;
    case RECOVERING:
      // Special recovery states...
      throw new NotImplementedException();
    case PAUSING:
      /*
       * The only way we can go from PAUSING to PAUSED is if all operations report in
       * and say they've finished their pausing sequence(i.e. they are in PAUSED)
       */
      if (builder.assertAtLeastOneInstanceAliveFromEachOperation().withAliveHeartbeats().notInState("ERROR").allInState("PAUSED")) {
        // Yes: everybody is started, so we can transition STARTING to STARTED
        return FlowState.PAUSED;
      }
      break;

    case STARTING:
      /*
       * The only way we can go from STARTING to STARTED is if all operations report in
       * and say they've finished their start up sequence (i.e. they are in STARTED).
       */
      
      // Are all operations online?
      for(Operation op : _flow.getOperations()) {
        if(builder.ofOperation(op).size() != op.getActualParallelism()) return FlowState.STARTING;
      }
      // Is there at least one alive for each operation and is everybody in the STARTED state?
      if (builder.assertAtLeastOneInstanceAliveFromEachOperation().withAliveHeartbeats().notInState("ERROR").allInState("STARTED", "IDLE", "CONSUMING_IDLE")) {
        // Yes: everybody is started, so we can transition STARTING to STARTED
        return FlowState.STARTED;
      }
      break;
    case CYCLE_COMPLETE:

      // Tell the sources that they may enter WAITING_FOR_NEXT_CYCLE, which will allow
      // them to start a new batch when we enter FlowState.RUNNING again
      if (builder.sources().assertAtLeastOneInstanceAliveFromEachOperation().withAliveHeartbeats().notInState("ERROR").allInState("WAITING_FOR_NEXT_CYCLE")) {

        // All operations are have consumed everything possible
        return FlowState.WAITING_FOR_NEXT_CYCLE;

      } else {
        sendCycleAcknowledged();                

      }
      break;
    case IDLE:
      // Only RPCs should be in idle, if the source goes back to EMITTING, then the flow should go back to RUNNING.
      if (builder.sources().assertAtLeastOneInstanceAliveFromEachOperation().anyInState("EMITTING") ||
          builder.nonSources().assertAtLeastOneInstanceAliveFromEachOperation().anyInState("ACTIVE", "CONSUMING", "EMITTING")) {
        return FlowState.RUNNING;
      }
      break;
    case RUNNING:
      
      // Detect when all of the tuples are out of the system
      if (builder.sources().assertAtLeastOneInstanceAliveFromEachOperation().withAliveHeartbeats().notInState("ERROR").allInState("EMIT_COMPLETE", "EMIT_COMPLETE_ACKED", "IDLE")) {
        
        // If all non-sources are done processing, we can get out of RUNNING state
        if (builder.nonSources().assertAtLeastOneInstanceAliveFromEachOperation().withAliveHeartbeats().notInState("ERROR").allInState("IDLE", "EMITTING_DONE") ) {
          if (builder.sources().assertAtLeastOneInstanceAliveFromEachOperation().withAliveHeartbeats().notInState("ERROR").allInState("IDLE")) {
            // Sources are in IDLE => RPC, we idle the flow in this case
            return FlowState.IDLE;
          } else {
            // builder.debugStates();
            // Otherwise we're a regular app, and we complete the cycle
            return FlowState.CYCLE_COMPLETE;
          }
        }
      }

      break;
    default:
      _log.error("Current flow state is invalid: " + currentState);
      break;
    }
    return currentState;
  }

  
  
  /***
   * For testing 
   * @param string
   * @throws CoordinationException 
   */
  protected void sendCycleAcknowledged() throws CoordinationException {
    Universe.instance().state().sendMessage(_flow.flowStateKey() + "/operation_commands", "cycle_acknowledged");
  }
  
}