Я хотел бы найти хорошую и надежную структуру MapReduce, которая будет использоваться из Scala.MapReduce реализация в Scala
ответ
Чтобы добавить ответ на Hadoop: есть как минимум две обертки Scala, которые делают работу с Hadoop более приятной.
Scala Карта Уменьшить (SMR): http://scala-blogs.org/2008/09/scalable-language-and-scalable.html
SHadoop: http://jonhnny-weslley.blogspot.com/2008/05/shadoop.html
UPD 5 октября 11
Существует также Scoobi рамки, которые имеют удивительную выразительность.
http://hadoop.apache.org/ не является агностиком.
Извините, но я не просил реализации Java. Действительно, Hadoop можно подключить к Scala, но код шаблона должен быть написан на Java. –
Напишите ScalaHadoopAdapter, который позаботится обо всем шаблоне и опубликует его как бесплатный/с открытым исходным кодом? – yfeldblum
шаблона не нужно писать в java. – jshen
Возможно, вас заинтересует scouchdb, интерфейс Scala для использования CouchDB.
Другой идеей является использование GridGain. ScalaDudes есть пример использования GridGain с Scala. И еще один пример: here.
Некоторое время назад я столкнулся с этой проблемой и в итоге написал небольшую инфраструктуру, чтобы упростить использование Hadoop от Scala. Некоторое время я использовал его самостоятельно, но я, наконец, нашел его в Интернете. Он назван (очень изначально) ScalaHadoop.
к точке дальнейшего jshen в:
Hadoop потокового просто использует сокеты. используя потоки unix, ваш код (любой язык) просто должен иметь возможность читать потоки с разделителями stdin и output tab. внедрить картограф и, если необходимо, редуктор (и, если необходимо, настроить его как объединитель).
Для scala API на верхней части hadoop проверьте Scoobi, он все еще находится в тяжелом развитии, но показывает много обещаний. Есть также некоторые попытки реализовать распределенные коллекции поверх хаопа в Scala incubator, но эти усилия еще не годятся к использованию.
Существует также новая оболочка scala для каскадирования из Twitter, называемая Scalding. После очень короткого обзора документации для Scalding кажется , что, хотя он делает интеграцию с каскадным гладкостью, он все еще делает не решить то, что я вижу в качестве основной проблемы с каскадом: тип безопасности. Каждая операция в каскадировании работает с кортежами каскадирования (в основном список значений полей с отдельной схемой или без нее), что означает, что ошибки типа , I.e. Присоединение ключа в виде строки и клавиши в виде длинного ведет к ошибкам во время выполнения.
У Scalding есть API-интерфейс типа: https://github.com/twitter/scalding/wiki/Type-safe-api-reference и в API полей (который вы упоминание), присоединение строки к длине не вызывает исключений во время выполнения (если они оба являются числами). Разумеется, в API типа безопасного такого компилятора запрещено объединение. –
Лично я стал большим поклонником Спарк
У вас есть возможность сделать в памяти кластерные вычисления, что значительно снижает накладные расходы вы бы испытать с диска ресурсоемких операций MapReduce.
- 1. MapReduce реализация с Akka
- 2. Scala mapreduce Программа WordCount
- 3. Scala: MapReduce на массиве
- 4. MapReduce контекстный вывод в Scala
- 5. Hadoop MapReduce Реализация RecordReader необходима?
- 6. Реализация ListNode в scala
- 7. Есть ли реализация Java индексатора в mapreduce?
- 8. Реализация абстрактных классов в Scala
- 9. Реализация пользовательской SortedMap в Scala
- 10. Реализация функции Scala в Java
- 11. Реализация NPlusK модели в Scala
- 12. Реализация интерфейса Java в Scala
- 13. Реализация двоичного дерева в Scala
- 14. Эффективная реализация катаморфизма в Scala
- 15. Scala OnCreate альтернативная реализация
- 16. Динамическая реализация Scala Enumeration
- 17. Scala Collection Конкретная реализация
- 18. Scala реализация учащемуся макро
- 19. Scala реализация фильтра sobel
- 20. реализация общего списка Scala
- 21. Scala: реализация функции Seq.distinctOn
- 22. Серийная реализация класса Scala
- 23. java hadoop mapreduce реализация кол-во совпадений
- 24. Scala MapReduce Framework, дающий несоответствие типов
- 25. Mapreduce с помощью Scala Error: java.lang.ClassNotFoundException: scala.Predef $
- 26. scala case class copy реализация
- 27. Scala Соответствующая реализация «Cache-Money»
- 28. Scala реализация startWith on Streams
- 29. Scala: реализация подтипа Numeric [T]
- 30. Реализация LINQ-подобных функций в Scala
SHadoop довольно старый - он использует старый механизм MR. Я обновил импликации в какой-то момент: https://github.com/schmmd/Hadoop-Scala-Commons – schmmd
Скальдинг также является опцией. https://github.com/twitter/scalding –