IndexWrapperMicroblogApi.java example

Explorer

twitter-tools-master
- twitter-tools-core
  - src
    - attic
      - java
        cc
        twittertools
        corpus
        data
        TSVStatusBlockReader.java
        TSVStatusCorpusReader.java
        download
        AsyncJsonStatusBlockCrawler.java
        VerifyJsonStatusBlockCrawl.java
    - main
      - java
        cc
        twittertools
        corpus
        data
        HTMLStatusExtractor.java
        JsonStatusBlockReader.java
        JsonStatusCorpusReader.java
        Status.java
        StatusStream.java
        demo
        ReadStatuses.java
        download
        AsyncEmbeddedJsonStatusBlockCrawler.java
        AsyncHTMLStatusBlockCrawler.java
        index
        ExtractTermStatisticsFromIndex.java
        ExtractTweetidsFromCollection.java
        ExtractTweetidsFromIndex.java
        IndexStatuses.java
        LowerCaseEntityPreservingFilter.java
        TweetAnalyzer.java
        search
        TrecTopic.java
        TrecTopicSet.java
        api
        RunQueriesBaselineThrift.java
        RunQueriesThrift.java
        SearchStatusesThrift.java
        TResultComparable.java
        TrecSearchHandler.java
        TrecSearchThriftClient.java
        TrecSearchThriftLoadGenerator.java
        TrecSearchThriftServer.java
        local
        RunQueries.java
        SearchStatuses.java
        stream
        GatherStatusStream.java
        thrift
        gen
        TQuery.java
        TResult.java
        TrecSearch.java
        TrecSearchException.java
        util
        ExtractSubcollection.java
        VerifySubcollection.java
    - test
      - java
        cc
        twittertools
        download
        FetchStatusTest.java
        index
        TokenizationTest.java
        search
        TrecTopicSetTest.java
- twitter-tools-hadoop
  - src
    - main
      - java
        cc
        twittertools
        hadoop
        Example.java
        hbase
        LoadWordCount.java
        WordCountDAO.java
        piggybank
        ConvertCreatedAtToEpoch.java
        GetLatitude.java
        GetLongitude.java
        IsMap.java
        udf
        GetDate.java
        GetInterval.java
        LuceneTokenizer.java
- twitter-tools-rm3
  - src
    - main
      - java
        edu
        illinois
        lis
        document
        FeatureVector.java
        feedback
        FeedbackModel.java
        FeedbackRelevanceModel.java
        query
        GQueries.java
        GQueriesJsonImpl.java
        GQuery.java
        TrecTemporalTopic.java
        TrecTemporalTopicSet.java
        rerank
        SearchReranker.java
        TResultComparator.java
        search
        RunQueries.java
        searchsource
        IndexWrapperMicroblogApi.java
        utils
        ExtractGqueriesFromTrecFormat.java
        KeyValuePair.java
        ListUtils.java
        LuceneQuery.java
        ParameterBroker.java
        Qrels.java
        Scorable.java
        ScorableComparator.java
        Stopper.java
- twitter-tools-ttgbaseline
  - src
    - edu
      - gslis
        ttg
        clusters
        Cluster.java
        Clusters.java
        clusterers
        SimpleJaccardClusterer.java
        jaccard
        JaccardStore.java
        main
        RunTTGBaseline.java
        searchers
        SimpleSearcher.java

package edu.illinois.lis.searchsource;

import java.util.HashMap;
import java.util.Iterator;
import java.util.List;
import java.util.Map;



import cc.twittertools.search.api.TrecSearchThriftClient;
import cc.twittertools.thrift.gen.TResult;
import edu.illinois.lis.document.FeatureVector;



public class IndexWrapperMicroblogApi {
	// API-specific variables
	private String hostname;
	private int port;
	private String groupId;
	private String authToken;

	private Map<String,String> seenDocs;	// we store the text of any docs we've harvested.  e.g. for FB.

	private TrecSearchThriftClient client;

	
	public IndexWrapperMicroblogApi(String hostname, int port, String groupId, String authToken) {
		this.hostname  = hostname;
		this.port      = port;
		this.groupId   = groupId;
		this.authToken = authToken;
		
		seenDocs = new HashMap<String,String>();
		
		try {
			client = new TrecSearchThriftClient(hostname, port, groupId, authToken);
		} catch (Exception e) {

		}
	}

	public double docCount() {
		return 0;
	}


	public double docFreq(String arg0) {
		return 0;
	}
	
	public double termFreq(String arg0) {
		return 0;
	}

	public double termTokenCount() {
		return 0;
	}

	public double termTypeCount() {
		return 0;
	}

	public Object getActualIndex() {
		return null;
	}
	
	public FeatureVector getDocVector(String docId) {
		if(seenDocs.containsKey(docId))
			return new FeatureVector(seenDocs.get(docId), null);

		// we should also be able to ping the API to get docs we haven't already seen
		return null;
	}

	public List<TResult> runQuery(String query, long upperBoundTime, int count) {
		List<TResult> results = null;
		try {
			results = client.search(query,upperBoundTime, count);
			
			// store our text for future reference
			Iterator<TResult> resultIterator = results.iterator();
			while(resultIterator.hasNext()) {
				TResult result = resultIterator.next();
				seenDocs.put(Long.toString(result.getId()), result.getText());
			}
		} catch (Exception e) {

		}
		return results;
	}


	




}