apache-spark tutorials and guides

Apache Spark Native Libraries

Nov 03, 2022

Drawbacks of Spark Streaming in Comparison With Real Streaming Computing Systems

Nov 01, 2022

distributed-computing apache-spark apache-storm

Multipart uploads to Amazon S3 from Apache Spark

Nov 03, 2022

file-upload amazon-s3 apache-spark jets3t

How can I make Spark Streaming count the words in a file in a unit test?

Nov 02, 2022

java unit-testing apache-spark spark-streaming

How do I use infinite Scala streams as source in Spark Streaming?

Nov 03, 2022

scala apache-spark spark-streaming

Spark MLLib Collaborative Filtering with new user

Nov 03, 2022

apache-spark apache-spark-mllib collaborative-filtering

Unable to add a new service with Cloudera Manager within Cloudera Quickstart VM 5.3.0

Nov 03, 2022

apache-spark cloudera cloudera-manager cloudera-quickstart-vm

How does partitions map to tasks in Spark?

Nov 02, 2022

apache-spark rdd

Spark 1.3.1: cannot read file from S3 bucket, org/jets3t/service/ServiceException

Nov 03, 2022

amazon-ec2 amazon-s3 apache-spark hadoop2

Apache Spark-Kafka.TaskCompletionListenerException & KafkaRDD$KafkaRDDIterator.close NPE on local cluster(Client Mode)

Nov 01, 2022

java hadoop apache-spark apache-kafka spark-streaming

How to do map and reduce in SparkR

Nov 01, 2022

apache-spark sparkr

Spark exception handling for json

Nov 02, 2022

json scala exception-handling apache-spark

elasticsearch-spark connector size limit parameter is ignored in query

Nov 02, 2022

scala elasticsearch apache-spark elasticsearch-hadoop

Reshape Spark DataFrame from Long to Wide On Large Data Sets

Nov 02, 2022

r scala apache-spark apache-spark-sql

What is the proper way of running a Spark application on YARN using Oozie (with Hue)?

Nov 01, 2022

apache-spark cloudera hadoop-yarn oozie hue

Treat Spark RDD like plain Seq

Nov 01, 2022

scala apache-spark functional-programming rdd

How to use Zeppelin to access aws spark-ec2 cluster and s3 buckets

Nov 02, 2022

amazon-s3 amazon-ec2 apache-spark apache-zeppelin

Algorithmic / coding help for a PySpark markov model

Nov 02, 2022

python algorithm machine-learning apache-spark pyspark

You need to build Spark before running this program error when running bin/pyspark

Nov 02, 2022

apache-spark apache-spark-sql pyspark spark-streaming spark-view-engine

Spark : how can evenly distribute my records in all partition

Nov 01, 2022

apache-spark

New posts in apache-spark