Ho lavorato per un po 'con alcune ricerche sviluppando uno strumento per recuperare i tweet da Twitter e elaborarli in qualche modo. Il primo prototipo "ha funzionato" ma è diventato un dolore perché abbiamo usato le prese per collegare diversi componenti. L'architettura era simile a questa:
Ilcontrolloredovevacreareattività(informazionisuitweetdesiderati)eillavorodeitrackereradiscaricarlierimandarlialcontrollerperesserememorizzatiedelaborati.AbbiamoutilizzatopiùtrackerperchéilimitidifrequenzadiTwittereabbiamoavutoterribili
Orasiamointeressatiariscriverel'interoprogettoestocercandounbuonapprocciopermigliorareleprestazionidellostrumento.Laprimaideasullascrivaniastausando
- RabbitMQ è adatto a questo tipo di attività?
- Il server RabbitMQ funziona come un lavoratore? Riceve attività per impostazione predefinita?
- Quando si utilizza Apache Flume, è possibile definire più agenti Twitter? So che è facile definire un agente da scaricare da Twitter, ma avrei bisogno di più istanze (tracker) in esecuzione su nodi diversi.
- È possibile sostituire dinamicamente le parole chiave dell'agente in Apache Flume.
- L'ultimo è una domanda ampia, mi dispiace per quello. Avete altre alternative oltre al RabbitMQ e al canale Apache?